최신글
-
가비지 컬렉터가 있는데 왜 메모리 누수가? weakref로 해결하기 "서비스가 점점 느려지더니 결국 서버가 다운됐습니다."어느 날 갑자기 메모리 사용량이 계속 증가하다가 서버가 멈춰버린 경험이 있으신가요? 분명 코드에는 문제가 없어 보이는데, 시간이 지날수록 메모리가 해제되지 않고 계속 쌓여만 가는 상황. 이것이 바로 '메모리 누수'입니다.파이썬은 직접 메모리를 관리해주지 않아도, 가비지 콜렉터가 자동으로 메모리를 관리해 주는 언어입니다. 가비지 콜렉터는 일정 주기로 실행되어 더 이상 사용되지 않는 객체들의 메모리를 해제해 줍니다. 이는 대부분 아주 잘 작동하지만, 가끔 문제가 생기기도 합니다.weakref 알아보기위와 같은 상황은 객체들끼리 서로 물리고 물리는 관계 (예를 들어 list나 dict에 어떤 객체를 저장)에 자주 발생합니다. 이럴 때, 파이썬의 weakre.. -
AWS SAA 시험 후기 및 학습법 공유 2025년 5월 3일, AWS Certified Solutions Architect - Associate (SAA-C03) SAA 시험에 합격했다. 약 두 달간 시험을 준비했는데, 노력한 만큼 좋은 결과를 얻게 되어 정말 기쁘고 뿌듯하다!이 글을 통해 AWS SAA 시험을 도전하게 된 이유와 학습 과정을 공유하고자 한다. 현재 시험을 준비하고 계시거나 앞으로 시험을 보실 분들에게 조금이나마 실질적인 도움이 되었으면 하는 바람이다.시험을 보게 된 이유자격증 취득을 결심하게 된 데에는 크게 두 가지 이유가 있었다.회사에서 이미 AWS를 꽤 활용하고 있었지만, 주먹구구식으로 운영하고 있는 듯한 느낌이 들었다. '어떠한 서비스를 사용할지', '더 효율적인 방법은 없는지'에 대한 고민 없이 관성적으로 AWS 인프.. -
25년 1분기를 돌아보며 들어가며25년의 첫 분기가 지나갔다. 지난해의 어려움을 뒤로하고 회사는 새로운 투자를 유치하며 안정적인 단계에 들어섰다. 작년에 비하면 훨씬 나은 상황이지만, 그만큼 책임감도 커졌다. 여러 회사와의 협업, 새로운 도메인에 대한 업무 등 도전적인 과제들이 기다리고 있다.부담감이 없진 않지만, 눈앞의 과제들을 하나씩 해결해 나가는 과정에서 성장할 수 있으리라 믿는다. 물론 BEP 달성 등 남은 과제와 이루어야 할 목표는 여전히 많다. 회사가 위기를 겪으며 배운 교훈들을 바탕으로, 같은 실수를 반복하지 않고 더 나은 방향으로 나아가고자 한다.1분기 정리정기적인 1 on 1 미팅 시작올해부터 팀원들과 매월 1 on 1 미팅을 시작했다. 사실 이전에는 정기적인 미팅 주간을 갖는 것이 형식적인 미팅이 될 수 있다고..
인기글
-
AWS SAA 시험 후기 및 학습법 공유 2025년 5월 3일, AWS Certified Solutions Architect - Associate (SAA-C03) SAA 시험에 합격했다. 약 두 달간 시험을 준비했는데, 노력한 만큼 좋은 결과를 얻게 되어 정말 기쁘고 뿌듯하다!이 글을 통해 AWS SAA 시험을 도전하게 된 이유와 학습 과정을 공유하고자 한다. 현재 시험을 준비하고 계시거나 앞으로 시험을 보실 분들에게 조금이나마 실질적인 도움이 되었으면 하는 바람이다.시험을 보게 된 이유자격증 취득을 결심하게 된 데에는 크게 두 가지 이유가 있었다.회사에서 이미 AWS를 꽤 활용하고 있었지만, 주먹구구식으로 운영하고 있는 듯한 느낌이 들었다. '어떠한 서비스를 사용할지', '더 효율적인 방법은 없는지'에 대한 고민 없이 관성적으로 AWS 인프.. -
배워봅시다 Draw.io '백문이 불여일견'이라는 말이 있습니다. '백 번 듣는 것이 한 번 보는 것만 못하다'는 뜻입니다. 이와 완전히 동일하지는 않지만, 백번 읽는 것보다 시각적으로 한 번 보는 것이 이해가 쉬운 경우가 많습니다. 정말 그런지 예시를 통해서 한 번 살펴보겠습니다. Velog라는 개발 블로그의 아키텍처는 다음과 같이 구성되어 있습니다. 프론트엔드 React로 만들어진 프로젝트를 AWS Lambda를 통해 서버사이드 렌더링 됩니다. Static File은 AWS S3에 저장되어 있고, CloudFront를 통해서 서비스됩니다. 백엔드 백엔드는 AWS Lambda를 통해 서비스되고, NAT Gateway를 통해서 AWS S3나 AWS SES 같은 외부 서비스에 접근합니다. 유저가 이미지를 업로드하면 백엔드 서버를 .. -
LangChain 고급 컴포넌트 (Agents, Tools, LangGraph) 활용하기 🚀 - 나만의 AI 비서 만들기 #2 들어가며지난 포스트에서는 LangChain의 기본 개념과 Models, Prompts, OutputParser, Chains와 같은 핵심 컴포넌트들을 살펴보았습니다. 이번 포스트에서는 Agents, Tools 그리고 LangGraph에 대해 자세히 알아보겠습니다.이 컴포넌트들을 활용해서 단순한 질문, 답변을 넘어서서 보다 복잡한 기능을 수행할 수 있는 AI 비서를 만들 수 있습니다.LangChain 설치랭체인을 사용하기 위해서는 라이브러리 설치가 필요합니다.pip install langchainAgents and Tools: 자율적인 AI 비서 만들기 🤖AgentsLangChain의 Agent는 AI 시스템이 자율적으로 문제를 해결하는 핵심 컴포넌트입니다. 다음과 같은 특징을 가지고 있습니다:자율적 의.. -
vscode에서 파이썬 개발환경 세팅하기 (가상환경, 개발도구) 안녕하세요, 이번 포스트에서는 vscode로 파이썬 개발을 시작하기 위해 개발 환경을 구성하는 방법에 대해서 다루어보겠습니다. 파이썬 관리 도구 및 가상환경, 패키지 매니저, 그리고 스타일 및 정적검사를 위한 개발 도구까지 소개해 보도록 하겠습니다. 파이썬으로 프로젝트를 구성하시는 분들에게 많은 도움이 되었으면 합니다. vscode 설치하기 우선 당연하게도 vscode를 설치해야 합니다. 아래 링크를 통해 본인의 환경에 맞는 vscode를 설치합니다. https://code.visualstudio.com/download 파이썬 설치 파이썬을 공식 홈페이지를 통해 설치할 수도 있지만, 저희는 pyenv라는 도구를 활용할 계획입니다. pyenv는 파이썬 버전을 쉽게 바꿀 수 있게 도와주는 툴입니다. 프로젝트.. -
파이썬의 컨텍스트 매니저 (Context Manager) 에 대해 알아봅시다. 기초 컴퓨터에서 사용할 수 있는 리소스는 제한적입니다. 따라서 사용한(acquired) 리소스는 종료해주는 것(released)이 중요합니다. 그렇지 않다면 프로그램이 종료된 이후에도 사용한 리소스가 계속 열려있는 resource leak현상이 발생합니다. f = open('memo.txt', 'r') print(f.read()) 위의 코드처럼 파일을 열고 닫아주지 않는다면, 파일이 계속 컴퓨터에 남아있을 확률이 있습니다. (대부분 Python이 종료해준다고 하긴 합니다.) >> Hello, World따라서 아래와 같이 열었던 파일을 닫아주어야 합니다. f = open('memo.txt', 'r') print(f.read()) f.close() 하지만, 코드가 복잡해지다보면 파일을 닫기전에 에러가 발생할..
-
파이썬 Typing 파헤치기 - 기초편 동적 언어에서의 타입 검사파이썬은 동적 언어로 잘 알려진 언어입니다. 즉, 변수의 타입을 일일이 명시하지 않아도 되고, 특정 변수의 타입이 중간에 바뀌어도 됩니다. 파이썬과 같은 동적 언어는 C, Java, Rust 등의 정적 언어보다 배우기도 쉽고, 좀 더 빠르게 프로그래밍이 가능하다는 장점이 있습니다. 하지만, 잘못된 타입을 사용하여 예상치 못한 에러를 만들어내고, 이로 인해 프로그램이 망가질 수 있다는 단점도 있습니다. 코드 양이 많아지고 복잡해질수록 잘못된 타입으로 인한 에러를 만날 확률이 높아지겠죠.따라서 최근에는 이런 동적 언어들에도 타입을 명시하고 검사하고자 하는 수요가 늘어나고 있습니다. Javascript계열에서는 Typescript가 많은 인기를 얻고 있으며, 파이썬 같은 경우도 3.5.. -
쉽게 설명하는 네트워크 (IP주소, DNS, 네트워크, 호스트, CIDR, Private IP, 포트포워딩) IP 주소가 뭔가요? IP 주소는 각각의 컴퓨터 기기가 서로 통신하기 위해 가지고 있는 네트워크 주소입니다. 우리가 우편주소로 집의 위치를 찾는 것처럼, 컴퓨터는 IP주소라는 주소체계를 통해 컴퓨터를 식별합니다. IPv4와 IPv6 IP 주소체계는 IPv4와 IPv6로 나눌 수 있습니다. IPv4 IPv4는 *8비트씩 4블럭으로 이루어져 있는 주소체계입니다. 현재 주로 활용되고 있는 주소체계입니다. 8비트는 10진수로 표현하면 0~255 (2^8 = 256) 까지의 값을 가집니다. 즉, 0~255가 4블럭으로 이루어졌다고 보셔도 됩니다. 이를 표현하면 아래와 같은 형태를 가지고 있습니다. 172.217.25.14 그렇다면 IPv4 주소체계로는 총 몇 개의 IP주소를 만들 수 있을까요? 8비트씩 4블럭이라.. -
가비지 컬렉터가 있는데 왜 메모리 누수가? weakref로 해결하기 "서비스가 점점 느려지더니 결국 서버가 다운됐습니다."어느 날 갑자기 메모리 사용량이 계속 증가하다가 서버가 멈춰버린 경험이 있으신가요? 분명 코드에는 문제가 없어 보이는데, 시간이 지날수록 메모리가 해제되지 않고 계속 쌓여만 가는 상황. 이것이 바로 '메모리 누수'입니다.파이썬은 직접 메모리를 관리해주지 않아도, 가비지 콜렉터가 자동으로 메모리를 관리해 주는 언어입니다. 가비지 콜렉터는 일정 주기로 실행되어 더 이상 사용되지 않는 객체들의 메모리를 해제해 줍니다. 이는 대부분 아주 잘 작동하지만, 가끔 문제가 생기기도 합니다.weakref 알아보기위와 같은 상황은 객체들끼리 서로 물리고 물리는 관계 (예를 들어 list나 dict에 어떤 객체를 저장)에 자주 발생합니다. 이럴 때, 파이썬의 weakre.. -
파이썬 Typing 파헤치기 - 심화편 지난 글 '파이썬 Typing 파헤치기 - 기초편'에서는 Typing의 기본적인 내용과 8개의 타입에 대해 다루어봤습니다. 이번 포스트에서는 조금 더 심화된 타입들에 대해 다뤄보도록 하겠습니다. 심화 타입 알아보기 1. tying.Callable[..., ReturnType] 지난 포스트에서 typing.Callable에 대해서 간단하게 다뤄봤습니다. 함수를 인자로 받는 경우에 Callable 타입을 활용하면 된다고 했습니다. def on_some_event_happened(callback: Callable[[int, str, str], int]) -> None: ... def do_this(a: int, b: str, c:str) -> int: ... on_some_event_happen.. -
Polars 시작하기 (소개 및 설치) - 자주쓰는 명령어로 배우는 Polars #1 안녕하세요, 데이터 처리와 분석을 위한 라이브러리 polars에 대해 들어보셨나요? Polars는 Pandas보다 빠른 성능과 직관적인 API로 최근 데이터 엔지니어와 사이언티스트 사이에서 큰 주목을 받고 있습니다.이전에 '자주 쓰는 명령어로 배우는 Pandas 시리즈'를 연재한 적이 있는데요, 이번에는 그와 유사하게 '자주 쓰는 명령어로 배우는 Polars 시리즈'를 작성해 보려고 합니다.이번 포스트에서는 Polars의 주요 특징과 설치 방법, 그리고 기본적인 사용법에 대해 알아보겠습니다.🤔 Pandas vs Polars: 무엇이 다를까?Pandas와 Polars는 모두 강력한 데이터 조작과 처리를 위한 라이브러리지만, 몇 가지 중요한 차이점이 있습니다:성능: Polars는 Rust로 작성되어 Pan.. -
LangChain 핵심 컴포넌트 (Prompt, Output Parser, Chain) 이해하기 🤖 - AI 비서 만들기 #1 들어가며 👋요즘 많은 분들이 ChatGPT, Claude 같은 AI 모델이나 서비스를 이용하고 있습니다. 저 역시 이런 도구들을 구독해서 사용하고 있었습니다. 하지만, 이러한 서비스를 이용하다 보니 몇 가지 아쉽거나 불편한 점들이 있었습니다.반복적인 작업을 할 때마다 새롭게 프롬프트를 작성하거나, 따로 프롬프트를 관리해야 하는 부담이 있었습니다. 보통 귀찮아서 대충 프롬프트를 작성했는데 그만큼 제가 원하는 퀄리티가 나오지 않는 경우가 많았습니다.ChatGPT, Gemini, Claude 등 너무나도 많은 모델들이 빠르게 출시되고 있으나, 모두 구독하기에는 금전적인 부담을 느꼈습니다.노션, 디스코드 같은 외부 툴과 연동해서 사용하면 생산성이 더 높아질 것 같은데 이런 부분의 지원이 제한적이었습니다.그러다.. -
Polars로 데이터 불러오기 및 조작하기 - 자주 쓰는 명령어로 배우는 Polars #2 안녕하세요! '자주 쓰는 명령어로 배우는 Polars' 시리즈의 두 번째 글입니다. 지난 글에서는 Polars의 주요 특징과 Pandas와의 차이점에 대해 알아보았는데요. 오늘은 본격적으로 Polars를 사용하여 데이터를 다루는 방법에 대해 알아보도록 하겠습니다.데이터 분석의 첫걸음은 데이터를 불러오는 것부터 시작합니다. Polars는 다양한 포맷의 데이터를 효율적으로 처리할 수 있으며, 대용량 데이터 처리에 장점을 가지고 있습니다. 이번 포스트에서는 데이터를 불러오고 기본적인 조작을 하는 방법에 대해 자세히 알아보겠습니다. 😊💡 여기서 사용하는 Polars 버전은 1.5입니다. polars 버전이 1 미만이면 예시 코드가 제대로 동작하지 않을 수 있습니다.먼저 필요한 라이브러리를 임포트하겠습니다. .. -
HTML을 이미지로 저장하기 - 트러블 슈팅 경험 공유 🔥 안녕하세요, 오늘은 제가 최근에 개발한 사이드 프로젝트 '퀵썸네일'을 만들면서 겪은 문제와 해결 방법에 대해 이야기해보려고 합니다. 퀵썸네일은 '몇 번의 간단한 클릭만으로 예쁜 썸네일을 빠르고 쉽게 만들 수 있는 프로젝트'인데요, HTML과 스타일 요소를 사용하고 있어서 HTML을 이미지로 저장하는 것이 핵심 기능이었습니다.트러블슈팅 #1: 사파리 이미지 저장 문제HTML을 이미지로 변환할 때 가장 유명한 라이브러리는 'html-to-image'입니다. 하지만 이 라이브러리를 사용하면 저장 시에 사파리 브라우저에서 이미지가 깨지는 문제가 있었습니다. 배경 이미지가 사라지거나, 폰트가 적용되지 않는 등의 문제가 존재했습니다.사파리나 파이어폭스 브라우저에서는 해당 라이브러리를 활용해서 이미지를 저장할 때 외.. -
선형방정식과 행렬에 대해 알아봅시다. 선형방정식과 행렬 지난 포스팅에서 선형방정식에 대해 간단히 다루어 봤습니다. 아래의 꼴을 가진 방정식을 선형방정식이라 불렀습니다. 행렬은 "수나 기호, 수식등을 사각형 형태로 배열"(위키백과)한 것을 의미합니다. 아래와 같은 모양을 하고 있습니다. 아래는 3 개의 행과 2 개의 열을 가지고 있는 3x2 행렬입니다. (각 원소의 아래첨자 중 앞에 있는 것이 행, 뒤에 있는 것이 열을 가리킵니다.) 바로 이 행렬로 선형방정식을 표현할 수 있습니다. 예를 들어 아래와 같은 세 개의 선형방정식이 있습니다. 위의 선형 방정식을 행렬로 표현하면 다음과 같이 표현할 수 있습니다. 행렬 곱은 따로 설명하지 않겠습니다. 행렬 곱에 대해 잘 모르시는 분들은 여기를 참고해주세요. 이를 일반화하면 다음과 같습니다. 아래와 같..
-
정규표현식의 표현식 그룹 이름 지정 (Named Capture Group)에 대해 알아봅시다. 정규표현식에서 ?P을 원하는 패턴 앞에 써주면 특정 표현식에 대해 이름으르 그룹을 지정할 수 있습니다. 예를 들어, 아래와 같이 사용하면 major, minor, patch 라는 이름으로 표현식 그룹을 만들 수 있습니다. (?P\d+)\.(?P\d+)\.(?P\d+) 괄호로 묶는 범위만큼 그룹이 생성되어 특정 그룹을 지정할 수 있습니다. (정규표현식에서 이렇게 일부 패턴을 뽑아내는 것을 캡처(Capture)라고 부릅니다.) 파이썬에서는 아래와 같이 사용할 수 있습니다. import re m = re.search(r"v(?P\d+)\.(?P\d+)\.(?P\d+)", "v1.2.3") m.group('major') # '1' m.group('minor') # .. -
정말로 단위 테스트를 통합 테스트보다 많이 작성해야 할까? 테스트 피라미드 통합 테스트를 줄이고, 단위 테스트를 많이 작성해야 한다는 말 들어보셨나요? 이러한 주장을 하면 보통 리팩터링의 저자 마틴 파울러의 테스트 피라미드를 예시로 사용합니다. 해당 그림을 보면 UI 테스트나 통합 테스트는 지양해야 할 대상처럼 보이고, 테스트 더블(e.g. 모킹)을 활용한 단위 테스트를 늘려야만 할 것 같습니다. 테스트 피라미드에 대한 논쟁 하지만 얼마 전 우연히 마틴 파울러의‘테스트 피라미드에 반박하는 트위터 게시글을 보게 되었습니다. “마틴 파울러의 테스트 피라미드는 시대가 지난 개념이다. 통합 테스트를 유닛 테스트보다 많이 작성하는 게 새로운 통념이다. 프론트엔드에서는 트로피 모양 테스트, 백엔드에서는 벌집 모양 테스트 등이 이를 뒷밤침한다.” 트위터에서 언급된 사람들 같.. -
자주쓰는 명령어로 배우는 Pandas #2 : Index와 Column 조작하기 자주쓰는 명령어로 배우는 Pandas 1편에 이어 2편입니다. 이번에는 Index와 Columns를 직접적으로 조작해보도록 하겠습니다. 1편에서 작성했던 코드 결과들은 계속 유지되니 직접 실습을 따라 하고 싶으신 분들은 1편을 참고해주세요. 지금까지의 데이터프레임은 이렇게 생겼습니다. df.head() 실행결과 Index 조작하기 Index 초기화 기존에 설정된 인덱스를 초기화하려면 reset_index 메소드를 사용하면 됩니다. df = df.reset_index() df.head() 실행결과 Index 설정하기 특정 컬럼을 Index로 설정하고 싶으시다면, 해당 컬럼을 set_index 메소드의 인자로 넣으시면 됩니다. df = df.set_index("username") df.head() 실행결과 .. -
프로그래밍 언어 선택의 5가지 기준 '어떤 프로그래밍 언어를 선택해야할까?' 위의 질문은 개발자들이 가장 고민하는 문제 중 하나입니다. 해당 주제를 가지고 굉장히 많은 블로그 포스트나 유튜브 영상이 있고, 해당 콘텐츠들의 조회수 역시 높습니다. 해당 문제를 가지고 커뮤니티들에서 논쟁이 벌어지기도 합니다. 저 역시 프로그래밍 언어 선택에 있어서 많은 고민을 했고, 아직도 하고 있습니다. 그렇다면 어떤 프로그래밍 언어를 선택하는 것이 좋을까요? 가장 완벽한 프로그래밍 언어가 있다면 좋겠지만, 아쉽게도 그러한 언어는 존재하지 않습니다. 특정한 분야에서 강점을 가지면, 다른 분야에서 약점을 가지기 마련입니다. 예를 들어, C나 C++ 같은 언어는 속도는 빠르지만, 배우기 어렵고 개발하는데 시간이 다른 언어들에 비해 오래 걸립니다. .. -
데이터 결합과 재구조화 🔄 - 자주 쓰는 명령어로 배우는 Polars #5 안녕하세요! '자주 쓰는 명령어로 배우는 Polars' 시리즈의 다섯 번째 글입니다. 지난 글에서는 데이터 그룹화와 집계에 대해 알아보았는데요. 오늘은 데이터 결합(Joining)과 재구조화(Reshaping) 기능에 대해 알아보도록 하겠습니다.데이터 분석을 하다 보면 여러 데이터셋을 하나로 합치거나, 데이터의 형태를 변환해야 하는 경우가 자주 있습니다. 특히 실무에서는 여러 소스의 데이터를 통합하고 분석하기 좋은 형태로 변환하는 작업이 매우 중요한데요. Polars는 이러한 작업을 효율적으로 수행할 수 있는 다양한 기능을 제공하고 있습니다. 😊💡 여기서 사용하는 Polars 버전은 1.5입니다. polars 버전이 1 미만이면 예시 코드가 제대로 동작하지 않을 수 있습니다.먼저 필요한 라이브러리를 .. -
Polars로 데이터 그룹화와 집계 📊 - 자주쓰는 명령어로 배우는 Polars #4 안녕하세요! '자주 쓰는 명령어로 배우는 Polars' 시리즈의 네 번째 글입니다. 지난 글에서는 데이터 필터링과 정렬에 대해 알아보았는데요. 오늘은 데이터 분석에서 매우 중요한 그룹화(Grouping)와 집계(Aggregation) 기능에 대해 알아보도록 하겠습니다.데이터를 그룹화하고 집계하는 과정을 통해 의미있는 인사이트를 얻을 수 있습니다. 예를들어, '지역별 매출 합계', '연령대별 고객 수' 등의 정보를 파악할 수 있습니다. Polars는 이러한 작업을 매우 효율적이고 직관적으로 수행할 수 있도록 다양한 기능을 제공하고 있습니다.오늘도 포켓몬 데이터 예시를 통해 그룹화와 집계에 대해 자세히 살펴보도록 하겠습니다. 😊💡 여기서 사용하는 Polars 버전은 1.5입니다. polars 버전이 1 .. -
파이썬 asyncio로 생산자/소비자 (Producer/Consumer) 패턴 구현하기 오늘은 파이썬에서 공식적으로 지원하는 비동기 라이브러리인 asyncio로 생산자/소비자 (Producer/Consumber) 패턴을 구현하는 방법에 대해서 다뤄보겠습니다. 해당 포스트에서 사용하는 모든 예시는 파이썬 3.11 버전 이상을 가정하고 있습니다. 비동기 프로그래밍과 생산자/소비자 (Producer/Consumer) 패턴 비동기 프로그래밍이란 비동기 프로그래밍은 모든 코드가 순차적으로 실행되는 동기식 프로그래밍과 달리, 작업에 대기가 발생했을 때 (e.g., 네트워크 요청 후 응답) 해당 작업이 끝나기 전까지 다른 작업을 수행하는 프로그램 방식을 의미합니다. 이를 통해 네트워크 입출력(I/O)와 같이 대기가 발생하는 일을 처리할 때 성능을 높일 수 있다는 장점이 있습니다. 보다 자세한 내용은 이.. -
[23년 5월 회고] 힘들었고, 즐거웠고, 많이 성장했다. 5월에는 주간회고를 올리지 못했다. 개인사정상 한 주를 쉬게 되었는데, 한 번 놓치니까 계속 놓치게 되더라. 5월은 특별히 월간 회고로 이를 대신한다. [메모어 종료 📕] 4월 마지막주에 회고 모임 메모어가 종료되었다. 해당 모임 덕분에 주간 회고를 꾸준히 쓸 수 있었고, 2번뿐이었지만 서울에 올라와서 처음 낯선 사람들을 만나고 교류했다. 다른 사람들의 회고를 읽거나 생각을 들으면서 세상에는 정말 다양한 사람들이 많다는 것을 느꼈다. 모임장님 덕분에 뮤지컬에도 관심을 가지게 되었다. 내 시야를 넓혀준 활동임은 분명하다. 아쉽게도 이번 기수 메모어는 참여하지 않는다. 다만, 나중에 다른 모임이 있다면 참여해 볼 생각이다. [회사 워크샵을 다녀왔다 🔥] 5월 26일~27일 회사 워크샵을 다녀왔다. 약 3년 .. -
파이썬 예제로 보는 직접 의존성과 간접 의존성 의존성 (Dependencies) 없는 프로그램은 존재하지 않습니다. 소프트웨어의 일부분(함수, 클래스, 모듈 등)은 어떤 기능을 수행하기 위해 다른 부분에 의존하고 있습니다. 그리고 의존성은 직접 의존성 (또는 명시적 의존성, Explicit Dependencies)과 간접 의존성 (또는 암시적 의존성, Implict Dependencies)으로 나눌 수 있습니다. 이번 포스트에서는, 이러한 의존성들의 정의와 각각의 장단점에 대해서 알아보는 시간을 가져보도록 하겠습니다. 😎 직접 의존성 직접 의존성은 어떤 함수나, 클래스가 각자의 인터페이스를 통해 '의존 대상'에 직접적으로 의존하고 있는 것을 의미합니다. 의존 대상이 인터페이스에 직접적으로 정의되어 있기 때문에 인터페이스만 보고도 의존하.. -
지금 노션 웹 클리퍼로 괜찮나요? 'Save to Notion'을 소개합니다. 웹 클리퍼는 이렇게 만드는 거야 : Save to Notion 안녕하세요, 지난 번 설치하지 않고 Notion 데스크탑 앱으로 이용하기 이후로 노션에 관한 두번째 포스팅입니다. 오늘은 웹페이지를 노션에 북마크 할 수 있는 놀라운 툴을 소개해드릴까 합니다. 'Save to Notion' 이라는 크롬 확장 도구입니다. 크롬뿐만이 아니라, 웨일이나 엣지 등의 크롬 기반 브라우저에서 모두 사용 가능합니다. 이미 노션에서 공식적으로 웹 클리퍼를 제공하고 있는데 왜 이 툴을 소개하는 걸까요? 노션 공식 웹 클리퍼의 불편함 저도 'Save to Notion'을 알기 전까지는 노션의 공식 웹 클리퍼를 사용하고 있었습니다. 저는 주로 하나의 블로그를 그때 그때 정독하는 편이 아닙니다. Medium, Velog, 혹은 F.. -
자주쓰는 명령어로 배우는 Pandas #4 : 데이터 능숙하게 다루기 자주쓰는 명령어로 배우는 Pandas 3편에 이어 4편입니다. 이번 편이 마지막 편입니다! 1편, 2편, 3편에서 작성했던 코드 결과들은 계속 유지되니 직접 실습을 따라 하고 싶으신 분들은 이전 시리즈를 참고해주세요. 지난번 실습까지 잘 따라오셨다면, 아래와 같은 데이터 프레임을 가지고 있으실 겁니다. df.head() 실행결과 참고사항: 이번 포스트에서 보여드리는 대부분의 예시에서는 원본 df를 변경시키지 않기 위해 연산 결과를 다시 df에 지정시키지 않습니다. 연산 결과로 데이터를 변경시키기 위해서는 df = 연산결과구문을 활용해서 원본 데이터를 변경해주시면 됩니다. 데이터 마스킹(Masking) 하기 요즘 코로나 때문에 모두들 마스크를 써서 입을 가리죠? 데이터에서도 일부 데이터를 가린다는 의미로 .. -
[TIL] Rust 공부 : Attribute, Modules, Null in Rust 등 Rust의 The Book을 다 보고, 복습 겸 실제 Rust 코드가 사용되는 예제를 보고 싶어 yaml-rust 공부를 시작했다. 잊어버린 개념이나 낯선 개념들을 찾아보면서 부족한 부분들을 메울 생각이다. Attribute 자유로운 형식의 메타데이터이다. 이름, 컨벤션, 컴파일러 등에 따라 해석되는 개념으로 정해진 역할이 있다기보다는 사용법을 익힐 필요가 있다. 커스텀으로 만들 수도 있지만, 우선적으로 Rust에서 자주 사용되는 Attribute는 익숙해질 필요가 있다. Syntax InnerAttribute : #![Attr] 해당 Attribute가 선언된 범위(scope) 내에서 적용된다. OuterAttribute : #[Attr] 해당 Attribute 이후에 오는 것(함수, 모듈, ...)에.. -
프로그래밍 폴더 구조에 대한 생각정리 코딩을 할 때 가장 고민을 많이 했던 부분이 바로 폴더 구조이다. 어떤 폴더들이 있어야 할지 그리고 해당 폴더들에는 어떤 파일들이 들어가야 할지가 정리가 잘 되지 않았다. 예를 들면 utils폴더와 libs폴더, core폴더의 차이점들은 뭔지, 현재 작업하고 있는 파일들은 utils로 봐야 할지 core로 넣어야 할지 등이 굉장히 애매했다. 얼마 전 팀원들이랑 관련해서 이야기를 나눴는데 역시 모두 다 해당 부분에 대해서 고민을 하고 있었다. 많이 고민해보고 여러 오픈소스들을 참고하면서 나름의 정리를 하게 되었고 해당 부분을 기록한다. 1. 정해진 정답은 없다. ⭕❌ 잘나가는 오픈소스들도 기준이 달랐다. utils.py나 utils.js처럼 utils를 파일로만 관리하는 곳도 있고, utils를 폴더로 관.. -
저항선과 지지선으로 바라본 한계와 성장 저항선을 뚫으면 지지선이다. 주식투자, 그중에서 기술적 분석의 기본은 지지선과 저항선이라고 할 수 있다. 기술적 분석에서 지지선이란 차트를 지지해주는 가상의 가격대를 의미하며, 저항선이란 차트의 상승을 가로막는(저항하는) 가상의 가격대를 의미한다. 즉, 지지선은 주가 하락을 방어해주는 역할을 하고 저항선은 주가 상승을 가로막는 역할을 한다. 흥미로운 점은 이러한 지지선과 저항선에서 돌파가 일어나게 되면 각각의 역할이 뒤바뀐다는 것이다. 즉, 주가의 하방 압력을 못 이겨내고 지지선이 아래로 돌파당하는 경우 해당 지지선이 저항선으로서 역할을 하고, 주가의 강력한 상승추세가 저항선을 돌파하게 되면 저항선은 지지선으로 바뀌게 된다. 주가의 상승을 가로막던 저항선이 주가가 떨어지지 않게 막아주는 지지선이 된다는 .. -
파이썬과 비동기 프로그래밍 #2, 파이썬에서 비동기 프로그래밍 시작하기 지난글에 이은 두번째 글입니다. 지난 글에서는 비동기 프로그래밍이 의미하는 바와 쓰레딩과 비동기의 차이점에 대해 알아봤습니다. 이번 글에서는 파이썬에서 어떻게 비동기를 구현할 수 있는지에 대해 알아보겠습니다. 용어정리 우선 용어부터 최대한 쉽게 설명해보겠습니다. 파이썬에서 비동기 프로그래밍을 하기 위해서는 이벤트 루프와 코루틴을 이해해야 합니다. 1. 이벤트 루프(Event Loop) 이벤트 루프는 작업들을 루프(반복문)를 돌면서 하나씩 실행시키는 역할을 합니다. 이때, 만약 실행된 작업이 특정한 데이터를 요청하고 응답을 기다려야 한다면, 이 작업은 다시 이벤트 루프에 통제권을 넘겨줍니다. 통제권을 받은 이벤트 루프는 다음 작업을 실행하게 됩니다. 그리고 응답을 받은 순서대로 멈췄던 부분부터 다시 통제권..
-
파이썬 단위 테스트 모듈 unittest에 대해 알아보자 기초 TDD (Test Driven Development) 또는 Test Case를 작성하기 위한 파이썬 내장 모듈입니다. unittest.TestCase를 상속받아 Custom Test Class를 정의합니다. test_로 시작하는 함수를 정의하면 unittest가 실행되면서 해당 함수를 테스트합니다. 예제 import unittest def add_two_numbers(a, b): return a + b class TestAdd(unittest.TestCase): def test_numbers_3_4(self): # 3+4 must be 7 self.assertEqual(add_two_numbers(3, 4), 7) def test_numbers_0_0(self): # 0+0 must be 0 sel..
-
25년 1분기를 돌아보며 들어가며25년의 첫 분기가 지나갔다. 지난해의 어려움을 뒤로하고 회사는 새로운 투자를 유치하며 안정적인 단계에 들어섰다. 작년에 비하면 훨씬 나은 상황이지만, 그만큼 책임감도 커졌다. 여러 회사와의 협업, 새로운 도메인에 대한 업무 등 도전적인 과제들이 기다리고 있다.부담감이 없진 않지만, 눈앞의 과제들을 하나씩 해결해 나가는 과정에서 성장할 수 있으리라 믿는다. 물론 BEP 달성 등 남은 과제와 이루어야 할 목표는 여전히 많다. 회사가 위기를 겪으며 배운 교훈들을 바탕으로, 같은 실수를 반복하지 않고 더 나은 방향으로 나아가고자 한다.1분기 정리정기적인 1 on 1 미팅 시작올해부터 팀원들과 매월 1 on 1 미팅을 시작했다. 사실 이전에는 정기적인 미팅 주간을 갖는 것이 형식적인 미팅이 될 수 있다고.. -
성능 최적화 및 SQL 활용 🚀 - 자주 쓰는 명령어로 배우는 Polars #6 안녕하세요! '자주 쓰는 명령어로 배우는 Polars' 시리즈의 마지막 글입니다. 이번에는 Polars의 성능 최적화와 SQL 기능 활용에 대해 자세히 알아보도록 하겠습니다.지금까지 Polars의 기본적인 데이터 처리 방법부터 그룹화, 결합, 재구조화 등 다양한 기능들을 살펴보았습니다. 오늘은 Polars의 성능을 극대화할 수 있는 최적화 기법들을 자세히 알아보면서, LazyFrame을 활용한 쿼리 최적화, 데이터 타입 최적화, 병렬 처리 등 실무에서 꼭 필요한 성능 개선 방법들을 살펴보도록 하겠습니다. 또한 SQL에 익숙한 사용자들을 위해 Polars에서 제공하는 SQL 기능도 함께 알아보겠습니다.💡 여기서 사용하는 Polars 버전은 1.5입니다. polars 버전이 1 미만이면 예시 코드가 제대로.. -
Polars로 데이터 필터링 및 정렬하기 - 자주 쓰는 명령어로 배우는 Polars #3 자주 쓰는 명령어로 배우는 Polars #3: 데이터 필터링과 정렬 🔍안녕하세요! '자주 쓰는 명령어로 배우는 Polars' 시리즈의 세 번째 글입니다. 지난 글에서는 데이터를 불러오고 기본적으로 조작하는 방법에 대해 알아보았는데요. 오늘은 필터링과 정렬 기능에 대해 알아보도록 하겠습니다.데이터 분석에서 필터링과 정렬은 매우 중요한 작업입니다. Polars는 이러한 작업을 빠르고 직관적으로 수행할 수 있도록 다양한 기능을 제공하고 있는데요. 실제 데이터를 활용한 예제를 통해 살펴보도록 하겠습니다. 😊💡 여기서 사용하는 Polars 버전은 1.5입니다. polars 버전이 1 미만이면 예시 코드가 제대로 동작하지 않을 수 있습니다.먼저 필요한 라이브러리를 임포트하고 예제 데이터를 불러와 보겠습니다. .. -
React Three fiber(R3F)로 배우는 인터렉티브 3D 웹 개발 | 유데미 수강후기 기술블로그로 알아보는 테크니컬 라이팅에 이어 'React Three fiber(R3F)로 배우는 인터렉티브 3D 웹 개발' 강의를 수강하였다. 회사에서 차트를 개발하는 일을 하며 Canvas를 다룰 일이 많았고, 자연스럽게 Webgl등에 관심을 가지게 되었다. 그러면서 Webgl을 활용해서 웹에서 3D를 구현하는 Three.js라는 기술에도 관심을 가지게 되었는데, 라이브러리만을 학습하기에는 뭔가 체계나 개념이 잡혀있지 않아 막막함이 있었다. 그러던 중, 글또를 통해 해당 강의를 수강할 수 있는 기회를 얻게 되었다.강의 소개해당 강의는 약 10시간 정도로 구성되어 있다. 설치/환경 설정부터 시작해서 웹 3D 렌더링에 필요한 여러 개념들을 체계적으로 설명한다. React와 Three.js, R3F 등의 여.. -
poetry와 github actions를 활용한 파이썬 라이브러리 배포 자동화 파이썬 개발을 하다 보면 필요한 라이브러리를 pip install 커맨드를 통해 쉽게 다운받아서 활용합니다. pandas, pydantic, fastapi 등 유명한 라이브러리가 많습니다. 이렇게 라이브러리를 설치해 사용하기도 하지만, 때로는 직접 라이브러리를 만들어서 배포하고 싶을 때가 있습니다. 파이썬에서는 어떻게 다른 사람들이 사용할 수 있는 라이브러리를 만들어 배포할까요? 오늘은 실습을 통해 직접 파이썬 라이브러리를 만들고, Github Actions를 이용해 라이브러리의 버전이 변경될 때마다 자동으로 배포하는 시스템을 만들어보겠습니다. poetry 소개 poetry는 의존성 관리 및 패키지 배포를 손쉽게 잘할 수 있도록 도와주는 도구입니다. poetry를 사용하지 않더라도 requirements.. -
기술블로그로 알아보는 테크니컬 라이팅 | 유데미 수강후기 글또 9기에서 Udemy 강의를 들을 수 있는 기회가 주어졌다. 여러 강의들 중에 '기술블로그로 알아보는 테크니컬 라이팅'을 선택했다. 기술 블로그를 작성하려고 할 때마다 항상 막막한 기분이 들었는데, 이번 기회에 글쓰기 실력을 더 개선하고 싶었다. 또한, 강사님이 '우아한형제들'의 테크니컬 라이팅 코치분이신데, 우아한형제들의 기술블로그를 많이 접하면서 정말 글이 훌륭하다는 생각을 많이 했다. 이러한 이유들로 해당 강의를 신청해 약 일주일간 강의를 들었다.강의 소개해당 강의는 크게 두 파트로 나눌 수 있다. 초반부에는 '테크니컬 라이팅'의 정의 등 전반적인 글쓰기에 대한 설명을 다룬다. 후반부에는 실제 기술문서를 작성하기 위해 '독자나 주제를 선정하는 방법', '초안 작성', 그리고 '문서 퇴고 방.. -
[23년 3월 3주차 회고] 위기의식을 느끼다 [인공지능 시대] 요즘 ChatGPT를 포함한 인공지능이 사회적으로 큰 화두가 되고 있다. 직접 ChatGPT를 사용해 보면서 엄청난 성능과 가능성에 엄청나게 놀라고 있다. 인공지능이 메인이 되는 세상이 올 거라고 생각했지만, 이렇게 까지 빠르고 무섭게 다가올지는 몰랐다. 중요한 건 현재는 인공지능의 초기 단계일 뿐이며, 앞으로 훨씬 더 급속도로 발전할 것이다. 그로 인해 세상은 엄청나게 빠른 속도로 달라질 것이다. 과거에 중요하게 여겨졌던 지식이나 스킬들이 더 이상 중요하지 않게 될 것이고, 많은 직업이 사라질 것이다. 이전에는 세부적인 지식들을 알고 있는 것들이 중요했다면, 이제는 전체적인 틀에서 숲을 보는 능력이 중요해질 것이다. 또한, 인공지능으로부터 올바른 답을 얻어내기 위한 스킬 (예를 들어 .. -
[23년 3월 1주차 회고] 피드백 루프 안으로 들어가기 [빅데이터 스터디 마무리] 드디어 내가 사내에서 진행한 빅데이터 수집 스터디가 끝났다. 강의가 워낙 많은 기술을 짧은 시간 내에 소개하는 거라 따라가기 쉽지 않았다. 하지만, 모두 마지막 실습과 과제까지 잘 마무리해 주었다. 스터디를 통해 전반적인 수집 흐름과 기술들에 대해서 이해할 수 있었다. 또한, 과제를 하면서 다른 많은 레퍼런스들을 참고했는데, 강의를 넘어선 다른 부분들을 많이 배울 수 있었고, 앞으로 더 깊게 공부해야 할 부분들을 찾을 수 있었다. 스터디 진행과 관련해서도 느끼고 배운 점이 많았다. 다음에 비슷한 스터디를 진행한다면 훨씬 잘 진행할 수 있을 것 같다. 😎 [휴일 테마 설정] 빅데이터 스터디 과제 제출 때문에 3월 1일은 해당 과제만 했다. 애초에 3월 1일은 해당 과제를 하는 날.. -
[23년 2월 3주차 회고] 우물안 개구리 탈출하기 [메모어 오프 모임] 토요일 메모어 모임을 다녀왔다. 이런 오프라인 모임을 참여하는 게 처음인데, 세상에는 멋진 사람들이 정말 많은 것 같다. 우물 안에서 나와서 다양한 사람들과 세상을 마주해야 할 용기가 필요하다. 그러다 보면 나도 조금씩 더 나은 사람이 될 수 있을 것 같다. 인상 깊었던 포인트 아이스브레이킹 목적으로 진행했던 게임(?) - 특정 키워드가 적힌 카드가 있고 뒤집으면 질문이 나오고, 돌아가면서 생각을 공유하는 게임이 있었는데 재밌었다. 온라인으로 만들어보면 재밌을 거 같다는 생각이 들었다. 회고를 진행할 때 상대방의 강점과 약점을 얘기하는 시간이 있다고 공유해 주셨다. 상대방의 약점을 얘기하거나 받아들이는 게 쉽지 않을 것 같다고 생각이 들었는데, 이야기를 듣고 나니 굉장히 시너지가 많.. -
AWS Secrets Manager로 쿠버네티스 시크릿(Secret)을 관리해보자 기존에는 시크릿을 그냥 yaml파일로서 생성해서 개인 컴퓨터에 가지고 있었습니다. 이 때는 사내에서 쿠버네티스를 관리하는 사람이 저밖에 없었기 때문에 크게 문제가 되지 않았습니다. 하지만, 어느새 쿠버네티스를 관리하는 팀원이 3명으로 늘어났습니다. 물론 시크릿 파일을 코드 저장소에 올리진 않았지만, 시크릿을 계속 파일로 관리하는 것은 보안적으로도 시스템적으로도 문제가 된다는 판단을 했습니다. 시크릿이 수정될 때마다 관리하는 팀원들에게 계속 공유를 해줘야했고, 누군가 해당 부분을 적용 안 한 상태로 수정사항을 적용할 경우 해당 시크릿이 누락되는 문제가 발생할 수 있었습니다. 이런 상황을 인지하고 AWS의 Secrets Manager를 활용하여 쿠버네티스의 Secret을 동기화할 수 있게하는 작업을 진행했습.. -
Vue3로 프로젝트를 진행하면서 알게 된 것들 최근에 Vue3와 Typescript를 학습하기 위한 목적으로 간단한 개인 프로젝트를 진행하였다. 해당 프로젝트를 진행하면서 알게 된 것들을 정리하고자 한다. Vue3에 대한 튜토리얼은 아니고, 시행착오에 대한 기록이라 할 수 있다. script setup Vue3의 composition api는 보통 아래와 같은 형태로 사용했다.(Vue.js 공식문서의 예제) 하지만, 최근 Vue의 공식문서를 보면 setup function을 쓰는 것보다 훨씬 단순하고, Props나 Event를 순수 Typescript를 활용해 선언할 수 있다. 그리고 런타임 시에 성능이 더 좋으며, IDE 지원이 잘된다고 한다. 해당 내용에 대해서 더 자세히 알고 싶다면 아래 공식문서를 확인하자. SFC 을 활용한 엄청난 규모의 오.. -
[TIL] Namespace, Scope, Claim이란 (feat. oAuth) # What I Learned Namespace 서비스의 custom claim이 다른 서비스나 예약된 claim과 충돌하는 것을 방지하기 위해 사용 주료 도메인을 사용함 e.g. https://engster.co.kr Scope 어떤 클레임들에 접근을 요청하고 있는지를 명시할 때 사용 Claim 유저정보나 메타정보에 관해 정보를 가지고 있는 Key/Value 짝(Pairs) 특정한 entity가 특정한 property를 가지고 있음을 나타냄 클레임들은 scope에 맵핑됨 (아래의 클레임들은 profile scope에 맵핑) { "family_name": "Silverman", "given_name": "Micah", "locale": "en-US", "name": "Micah Silverman", "p.. -
파이썬 3.7부터 도입된 dataclasses에 대해 알아보자 Sanic에서 웹소켓을 구현하는 예제를 보던 중 클래스 위에 @dataclass라는 데코레이터가 붙어있었다. from dataclasses import dataclass, field ...(생략) @dataclass class Client: interface: websockets.server.WebSocketServerProtocol = field(repr=False) sid: str = field(default_factory=partial(generate_code, 36)) ...(생략) 찾아보니 파이썬 3.7부터 표준 라이브러리로 등재되었다고 한다. 파이썬 3.6에서 사용하기 위해선 pip install dataclasses를 통해 사용할 수 있다. (파이썬 3.6 지원불가) 이는 데이터 클래스를 보.. -
Asnycio Lock에 대해 알아보자. asyncio는 한 개의 쓰레드에서 돌아가지만, 동시성이 존재한다. 이 때문에, 잘 못 쓰면 작업들이 예상치 못한 순서로 일어날 수도 있다. threading이나 multiprocessing에서와 같은 Lock을 사용하면 예기치 못한 상황을 예방할 수 있다. (save concurrency) Example Without Lock import asyncio import random owner = None async def coro1(): global owner owner = 'IAMMAN' print(f"I am owner, {owner}") await asyncio.sleep(random.random()) print(f"{owner} is man.") async def coro2(): gl.. -
Notion 설치하지 않고 데스크탑 앱으로 이용하기 Notion 소프트웨어를 사용하다보면 가끔 에러가 나서 다시 설치해야하는 문제를 겪곤했습니다. 그리고 리눅스환경에서 Notion을 크롬에서만 이용할 수 있기 때문에 불편을 겪을 떄가 많습니다. (저만 그런가요?) Notion은 소프트웨어와 웹의 환경의 95%이상 일치하기 때문에 크롬의 바로가기만들기를 통해 웹사이트를 앱으로 만들면 데스크탑앱처럼 이용할 수 있습니다. 웹이기 때문에 심지어 설치나 업데이트도 필요하지 않습니다. 그럼 어떻게 웹을 데스크탑 앱으로 만들 수 있는지 알아봅시다. 우선, 노션 웹페이지로 갑니다. 이 때 웹에서 로그인한 적이 있는 경우 바로 자신의 페이지로 가게됩니다. url을 살펴보시면 아래 사진과같이 notion.so 이후에 이상한 문자의 주소가 붙어있는 것을 확인할 수 있습니다... -
[TIL] 파이썬 typing 모듈을 사용할 때 Import Error가 나는 경우 파이썬에서 typing 모듈을 사용할 때, circular import 이슈가 발생할 때가 있다. 예를 들어서 # core/alphabets.py from .character import Character class Alphabets(): def __init__(self): self.alphabet_list = [] def add_alphabet(self, character: Character): self.alphabet_list.append(character) def remove_character(self, char: str): for i in range(len(self.alphabet_list)): if self.alphabet_list[i].char == char: del self.alphabet_.. -
파이썬으로 만드는 나만의 커맨드라인 프로그램 #2 - click 지난 시간에는 argparse모듈을 활용해 커맨드 라인 프로그램을 만드는 법에 대해 알아봤습니다. 이번에는 click모듈을 사용하여 커맨드 라인 프로그램을 만드는 법에 대해 소개하겠습니다. click 모듈 argparse뿐만이 아니라 click모듈도 많이 사용됩니다. click모듈은 argparse에서 제공하는 기능을 보다 쉽고, decorator를 사용해 보다 깔끔하게 사용할 수 있게 해줍니다. Flask에서 CLI(Command Line Interface)를 구현하기 위해 사용한 모듈이기도 합니다. click을 사용하여 argparse와 똑같은 코드를 작성해보겠습니다. 이번엔 프로젝트명을 hello 대신 cello를 사용하겠습니다. # cello/main.py import click import sy..
-
[요약] 데이터 아웃라이어 처리하기 How to Deal with Outliers in Your Data 내용을 한글로 정리해 보았습니다. 아웃라이어란? 아웃라이어란 데이터 상의 다른 값들의 분포와 비교했을때 비정상적으로 떨어져있는 관측치이다. 하지만, 어느정도가 비정상적으로 떨어져 있는 데이터인지 말하기는 참 모호하다. 아웃라이어의 정도에도 차이가 있다. (Mild outliers / Extrem outliers) 아웃라이어는 실제로 가치있는 정보를 담고 있을 수도 있으며, 기록의 실수인한 무의미한 정보일 수도 있다. 따라서 아웃라이어의 실제 의미가 무엇인지에 대해 의문을 품고, 분석할 필요성이 있다. 데이터에서 어떻게 아웃라이어를 잡아낼 것인가 Data visualization은 데이터 분석에 있어서 필수적이다.소통을 하기위해서도 중요..
-
파이썬과 비동기 프로그래밍 #3, 파이썬에서 비동기 프로그래밍 활용하기 지난글에 이은 세번째 글입니다. 지난 글에서 파이썬에서 비동기를 구현하는 법에 대해 알아봤습니다. 이번 글에서는 어떻게 비동기를 활용할 수 있을지에 대해 알아봅시다. 비동기를 사용하면 네트워크 IO의 지연 때문에 낭비되는 시간을 줄일 수 있습니다. 온라인 사전사이트에서 단어들의 의미를 크롤링하는 코드를 작성한다고 가정해봅시다. 동기적인 방식을 사용한다면 아래와 같이 코드를 작성할 수 있습니다. 동기적 방식 # requests와 bs4 설치 필요 import requests import time from bs4 import BeautifulSoup def get_text_from_url(url): print(f'Send request to ... {url}') res = requests.ge..