nginx: bot/스크래퍼 차단 (map 기반)

User-Agent 패턴을 map으로 분류하고, 필요한 엔드포인트만 보수적으로 차단하는 방법

분야: DevOps/인프라 nginxbotsecurityrate-limit

의미 없는 봇 트래픽/스크래핑이 늘면, 서버 비용과 장애 확률이 같이 올라갑니다. “전면 차단”은 오탐이 많아질 수 있으니, 보통은 API/검색/로그인 같은 민감 엔드포인트부터 단계적으로 적용합니다.

관련 가이드: 봇 트래픽/어뷰징 대응 체크리스트 (nginx)

1) map으로 위험 User-Agent 플래그 만들기

map $http_user_agent $is_suspicious_ua {
  default 0;
  ~*(scrapy|python-requests|curl|wget) 1;
  ~*(headlesschrome|phantomjs) 1;
}

2) 특정 위치에서만 차단하기 (예: /api/)

location ^~ /api/ {
  if ($is_suspicious_ua) { return 403; }
  proxy_pass http://127.0.0.1:3000/;
}

3) rate limit과 같이 쓰기

limit_req_zone $binary_remote_addr zone=api:10m rate=10r/s;

location ^~ /api/ {
  limit_req zone=api burst=20 nodelay;
  proxy_pass http://127.0.0.1:3000/;
}

체크리스트

먼저 log_format/access log로 “누가 때리는지” 확인한 뒤 규칙을 만든다
오탐을 고려해 “차단”보다 “완화(레이트 리밋)”부터 시작하는 경우가 많다
앱에서도 인증/권한/쿼터 정책을 함께 둔다

같은 분야의 템플릿

Dockerfile: Node 프로덕션 기본 패턴

멀티스테이지 빌드로 이미지 크기를 줄이는 기본 예시

journalctl: systemd 서비스 장애 디버깅

status/journalctl로 장애 원인을 빠르게 좁히는 실무 명령어 모음

nginx: ACME(Let’s Encrypt) webroot 챌린지 설정

/.well-known/acme-challenge/ 경로만 안전하게 열어 certbot/ACME HTTP-01을 통과시키는 패턴

nginx: 서브패스(/admin)에서 SPA 서빙 (alias + fallback)

/admin 아래에 React/Vue SPA를 배포할 때 새로고침 404를 막는 alias/try_files 패턴

nginx: 민감 파일(.env/.git/백업) 차단

실수로 웹루트에 올라온 시크릿/백업이 유출되지 않도록 기본 차단 룰을 추가

nginx: /healthz JSON 엔드포인트 빠르게 만들기

업스트림 없이 nginx만으로 상태 확인용 엔드포인트를 제공하는 패턴(로드밸런서/모니터링용)