캐시 기본 동작

 

캐시가 없을 때

첫 번째 요청

두 번째 요청

위와 같이 똑같은 작업을 합니다.

 

캐시가 없을 때

  • 데이터가 변경되지 않아도 계속 네트워크를 통해서 데이터를 다운로드 받아야 합니다.
  • 인터넷 네트워크는 매우 느리고 비쌉니다.
  • 브라우저 로딜 속도가 느립니다.
  • 때문에 느린 사용자 경험

 

 

캐시 적용

첫 번째 요청

cache-control을 통해 캐시가 유효한 시간(초)를 설정할 수 있습니다. 위의 경우 60초동안은 캐시가 유효하게 됩니다.

두 번째 요청

 

캐시 적용

  • 캐시 덕분에 캐시 가능 시간동안 네트워크를 사용하지 않아도 됩니다.
  • 비싼 네트워크 사용량을 줄일 수 있습니다.
  • 브라우저 로딩 속도가 매우 빠릅니다.
  • 때문에 빠른 사용자 경험

 

세 번째 요청 - 캐시 시간 초과

 

캐시 시간 초과

  • 캐시 유효 시간이 초과하면, 서버를 통해 데이터를 다시 조회하고, 캐시를 갱신해야 합니다.
  • 이때 다시 네트워크 다운로드가 발생합니다.

 

 

 

검증 헤더와 조건부 요청1

캐시 유효 시간이 초과해서 서버에 다시 요청하면 알의 두 가지 상황이 나타납니다.

  1. 서버에서 기존 데이터를 변겸함
  2. 서버에서 기존 데이터를 변경하지 않음

1번의 경우는 다시 받아야 하는 것이지만, 2번의 경우는 다시 받을 필요가 없는데 다시 다운받는 불필요한 다운로드를 하게됩니다.

이러한 문제를 해결하기 위한 것이 검증 헤더와 조건부 요청입니다.

검증 헤더는 Last-Modified라는 마지막으로 수정된 시간을 통해 검증을 하는 헤더입니다.

조건부 요청은 if-modified-since라는 수정된 시간을 통해 캐시를 다시 사용해도 되는지에 대한 요청입니다.

 

검증 헤더 추가

첫 번째 요청

Last-Modified는 마지막에 수정된 시간입니다. (원래는 UTC 표기법을 사용해야 합니다.)

기존 캐시엔 최종 수정일을 등록하지 않았지만, 서버 응답에서 Last-Modified로 왔기때문에 캐시에 추가해줍니다.

캐시 시간 초과된 후 두 번째 요청

1                                                                                                                            2
3                                                                                                                            4
5                                                                                                                            6

  1. 캐시에 데이터 최종 수정일이 적혀있으면, HTTP 요청 헤더에 if-modified-since에 날짜를 붙인다음 서버로 요청합니다.
  2. 서버에서 요청을 받을 때, if-modified-since가 왔음을 확인합니다.
  3. 서버에서 if-modifiefd-since와 같은 데이터 수정일을 확인합니다.
  4. 같은 수정일이 있는 데이터가 있으면, HTTP 응답을 만들 때 HTTP Body를 비우고 304 Not Modified로 보냅니다. 나머진 이전에 보냈던 헤더와 똑같이 보냅니다. (이렇게하면 0.1M 전송하는 데이터 용량을 줄일 수 있습니다.)
  5. 웹 브라우저에서는 304 Not Modified를 보면 캐시에 있는데이터와 서버에 있는 데이터가 동일하니 캐시에 있는 데이터를 사용해도 됨을 알 수 있습니다. 이를받고 응답 결과를 재사용하며, 헤더 데이터를 갱신합니다.
  6. 해당 캐시는 다시 60초동안 유효하게됩니다.

 

검증 헤더와 조건부 요청 - 정리

  • 캐시 유효 시간이 초과해도, 서버의 데이터가 갱신되지 않으면
  • 304 Not Modified + 헤더 메타 정보만 응답(body X)
  • 클라이언트는 서버가 보낸 응답 헤더 정보로 캐시의 메타 정보를 갱신
  • 클라이언트는 캐시에 저장되어 있는 데이터 재활용
  • 결과적으로 네트워크 다운로드가 발생하지만 용량이 적은 헤더 정보만 다운로드
  • 매우 실용적인 해결책

실제로 개발자 도구를 열었을 때 Status의 색이 연한 것은 캐시에서 가져온 데이터입니다.

캐시에 저장된 데이터를 더블클릭 -> 개발자 도구 -> 새로고침 을 하면 304 status로 나온다고하는데 저는 잘 안되네요ㅠㅠ

 

정리

  • If-Modified-Since : 이후에 데이터가 수정 되었으면?
  • 데이터 미변경 예시
    • 캐시 : 2020년 11월 10일 10:00:00 vs 서버 : 2020년 11월 10일 10:00:00
    • 304 Not Modified, 헤더 데이터만 전송
    • 전송 용량 0.1M
  • 데이터 변경 예시
    • 캐시 : 2020년 11월 10일 10:00:00 vs 서버 2020년 11월 10일 11:00:00
    • 200 OK, 모든 데이터 전송
    • 전송 용량 1.1M

 

검증 헤더와 조건부 요청 2

  • 검증 헤더
    • 캐시 데이터와 서버 데이터가 같은지 검증하는 데이터
    • Last-Modifeid (위에서 알아보았던 것), ETag (알아 볼 것)
  • 조건부 요청 헤더
    • 검증 헤더로 조건에 따른 분기
    • If-Modified-Since : Last-Modified 사용
    • If-None-Match : ETag 사용
    • 조건이 만족하면 200 OK
    • 조건이 만족하지 않으면 304 Not Modified

 

검증 헤더와 조건부 요청

Last-Modified, If-Modified-Since 단점
  • 1초 미만(0.x초) 단위로 캐시 조정이 불가능 (최대 할 수 있는 단위가 1초이상 단위입니다.)
  • 날짜 기반의 로직 사용
  • 데이터를 수정해서 날짜가 다르지만, 같은 데이터를 수정해서 데이터 결과가 똑같은 경우 (A -> B -> A로 다시 수정된 경우, 데이터는 같지만 마지막 수정일은 다르게 됩니다.)
  • 서버에서 별도의 캐시 로직을 관리하고 싶은 경우
    • 예) 스페이스나 주석처럼 크게 영향이 없는 변경에서 캐시를 유지하고 싶은 경우

 

검증 헤더와 조건부 요청

ETag, If-None-Match (Last-Modified, If-Modified-Since 단점 보완)
  • ETag(Entity Tag)
  • 캐시용 데이터에 임의의 고유한 버전 이름을 달아둠
    • 예) ETag: "v1.0", ETag : "a2jiodwjekjl3"
  • 데이터가 변경되면 이 이름을 바꾸어서 변경함 (Hash를 다시 생성)
    • 예) ETag : "aaaaa" -> ETag : "bbbbb"
  • 진짜 단순하게 ETag만 보내서 같으면 유지, 다르면 다시 받기!

 

ETag, If-None-Match 첫 번째 요청

 

ETag, If-None-Match 두 번째 요청
- 캐시 시간 초과

1                                                                                                                            2

 

3                                                                                                                            4

 

5                                                                                                                            6

 

정리

  • 단순하게 ETag만 서버에 보내서 같으면 유지, 다르면 다시 받기
  • 캐시 제어 로직을 서버에서 완전히 관리
  • 클라이언트는 단순히 이 값을 서버에 제공(클라이언트는 캐시 메커니즘을 모름)
  • 예)
    • 서버는 배타 오픈 기간인 3일 동안 파일이 변경되어도 ETag를 동일하게 유지
    • 애플리케이션 배포 주기에 맞추어 ETag 모두 갱신

 

 

 

캐시와 조건부 요청 헤더

 

캐시 제어 헤더

  • Cache-Control : 캐시 제어
  • Pragma : 캐시 제어 (하위 호환)
  • Expires : 캐시 유효 기간 (하위 호환)

 

Cache-Control

캐시 지시어 (directives)
  • Cache-Control : max-age
    • 캐시 유효 시간, 초 단위
  • Cache-Control : no-cache
    • 데이터는 캐시해도 되지만, 항상 원(origin) 서버에 검증하고 사용 (원 서버란 캐시 서버, 프록시 서버가 아닌 진짜 서버)
  • Cache-Control : no-store
    • 데이터에 민감한 정보가 있으므로 저장하면 안됨 (메모리에서 사용하고 최대한 빨리 삭제)

 

Pragma

캐시 제어 (하위 호환)
  • Pragma : no-cache
  • HTTP 1.0 하위호환

 

Expires

캐시 만료일 지정 (하위 호환)
  • expires : Mon, 01 Jan 1990 00:00:00 GMT
  • 캐시 만료일을 정확한 날짜로 지정
  • HTTP 1.0 부터 사용
  • 지금은 더 유연한 Cache-Control:max-age 권장
  • Cache-Control:max-age와 함께 사용하면 Expires는 무시

 

 

 

프록시 캐시

 

원 서버 직접 접근

origin 서버

이렇게 클라이언트마다 원 서버로 접근하게되면 500ms를 다운로드 받을 때마다 0.5초를 소모하게 됩니다. 이러한 시간을 단축시키고자 프록시 서버라는 것이 등장하게 됩니다.

 

프록시 캐시 도입

첫 번째 요청

이러한 프록시 캐시 서버 덕분에 유튜브, 넷플릭스 같은 서비스를 모든 나라에서 빨리 볼 수 있는 것 입니다. (이를 증명하는 것은 한국서버에서 한국인이 자주 보는 동영상은 로딩 속도가 되게 빠르지만, 한국인이 잘 보지 않는 외국 기술 동영상들을 보면 로딩 속도가 매우 느립니다.)

 

Cache-Control

캐시 지시어(directives) - 기타
  • Cache-Control : public
    • 응답이 public 캐시에 저장되어도 됨
  • Cache-Control : private
    • 응답이 해당 사용자만을 위한 것임, private 캐시에 저장해야 함(기본값) (공용으로 사용되는 이미지는 public에 저장 되도 되지만, 개인 정보같은 경우는 public에 저장되면 안되기 때문)
  • Cache-Control : s-maxage
    • 프록시 캐시에만 적용되는 max-age
  • Age : 60 (HTTP 헤더)
    • 오리진 서버에서 응답 후 프록시 캐시내에 머문 시간(초)

 

 

 

캐시 무효화

 

Cache-Control

확실한 캐시 무효화 응답
  • Cache-Control을 적지 않아도 많이 사용 되는 경우 임의로 캐시에 등록 될 수 있기 때문에, 절대 캐시가 되면 안되는 페이지는 아래와 같은 작업을 해주어야 합니다.
  • Cache-Control : no-cache, no-store, must-revalidate
  • Pragma : no-cahce
    • HTTP 1.0 하위 호환

 

Cache-Control

캐시 지시어(directives) - 확실한 캐시 무효화
  • Cache-Control : no-cache
    • 데이터는 캐시해도 되지만, 항상 원 서버에 검증하고 사용
  • Cache-Control : no-store
    • 데이터에 민감한 정보가 있으므로 저장하면 안됨
  • Cache-Control : must-revalidate
    • 캐시 만료후 최초 조회 시 원 서버에 검증해야 함
    • 원 서버 접근 실패시 반드시 오류가 발생해야 함 - 504 Gateway Timeout
    • must-revalidate는 캐시 유효 시간이라면 캐시를 사용함
  • Pragma : no-cahce
    • HTTP 1.0 하위 호환

 

no-cache vs must-revalidate

no-cache 기본 동작

1

 

2

 

3

3번의 경우 프록시 캐시에서 원 서버의 장애로 장애를 웹 브라우저에 보내기보다는 이전 데이터라도 쓰라며 200 OK를 보내는 경우가 있다고 합니다. 이것이 no-cache의 정책입니다.

 

must-revalidate

위의 no-cache인 캐시 지시어는 프록시 캐시에서 원 서버로 접근하는 네트워크가 단절되도 웹 브라우저한테는 이전의 데이터로라도 사용하라며 200 OK를 보내주지만, must-revalidate의 경우는 원 서버와 네트워크가 되지 않으면 웹 브라우저에게 504 Gateway Timeout의 응답을 줍니다. 이것이 no-cache와 must-revalidate의 차이 입니다.

 

 

 

 

 

출처

 

모든 개발자를 위한 HTTP 웹 기본 지식 - 인프런 | 강의

실무에 꼭 필요한 HTTP 핵심 기능과 올바른 HTTP API 설계 방법을 학습합니다., - 강의 소개 | 인프런...

www.inflearn.com

 

+ Recent posts