삼일오일사
close
프로필 사진

삼일오일사

github: @zjacom

  • 분류 전체보기 (115)
    • Book (66)
      • Learning SQL (9)
      • SQL 레벨업 (8)
      • 견고한 데이터 엔지니어링 (5)
      • 운영체제 (2)
      • 스파크 완벽 가이드 (9)
      • 파이썬 코딩의 기술 (29)
      • 분산 컴퓨팅 (4)
    • 개발 (31)
    • 기타 (10)
      • 출퇴근 공부 간단 정리 (7)
    • ELK (6)
  • 홈
  • 태그
  • 방명록

GCP VM Instance 저스펙으로 Airflow 서버 구축하고 안정적으로 크롤링하기

첫 번째 문제 - Small Instance에 Airflow 서버 구축개인 프로젝트를 하면서 5분 단위로 크롤링하여 데이터를 수집하고 싶었다.이를 위해 Lambda + EventBridge와 EC2 + Airflow를 고민하다가 비용적인 측면에서 후자가 유리할 거 같았다.이 링크를 참고하여 최대한 스펙이 낮은 EC2에 Airflow 서버를 구축했다. 처음에는 1GB RAM을 가진 인스턴스에서 Airflow 서버 구축을 시도했지만 메모리 부족 한계에 부딪혔다.이에 따라 아래와 같이 스왑 메모리도 설정해봤지만 역부족이었다.sudo fallocate -l 3G /swapfilesudo chmod 600 /swapfilesudo mkswap /swapfilesudo swapon /swapfileecho '/sw..

  • format_list_bulleted 개발
  • · 2024. 11. 14.
  • navigate_before
  • 1
  • navigate_next
공지사항
  • 31514의 이전 블로그는 여기로!
전체 카테고리
  • 분류 전체보기 (115)
    • Book (66)
      • Learning SQL (9)
      • SQL 레벨업 (8)
      • 견고한 데이터 엔지니어링 (5)
      • 운영체제 (2)
      • 스파크 완벽 가이드 (9)
      • 파이썬 코딩의 기술 (29)
      • 분산 컴퓨팅 (4)
    • 개발 (31)
    • 기타 (10)
      • 출퇴근 공부 간단 정리 (7)
    • ELK (6)
인기 글
전체 방문자
오늘
어제
Copyright © 31514 모든 권리 보유.
SKIN: Copyright © 쭈미로운 생활 All rights reserved. Designed by JJuum.
and Current skin "dev-roo" is modified by Jin.

티스토리툴바