6 분 소요

 인프런 모든 개발자를 위한 HTTP 웹 기본 지식을 학습하고 정리한 내용 입니다.

HTTP 헤더 개요

  • header-field : = field-name “:” OWS field-value OWS (OWS:띄어쓰기 허용)
  • field-name은 대소문자 구문 없음

HTTP 헤더 용도

  • HTTP 전송에 필요한 모든 부가 정보
  • 예) 메시지 바디의 내용, 메시지 바디의 크기, 압축, 인증, 요청 클라이언트, 서버 정보, 캐시 관리 정보 등
  • 표준 헤더가 너무 많음
  • 필요시 임의의 헤더 추가 가능
    • helloworld: hihi

HTTP 헤더 분류 - RFC2616(과거)

  • General 헤더: 메시지 전체에 적용되는 정보, 예) Connection: close
  • Request 헤더: 요청 정보, 예) User-Agent: Mozilla/5.0 (Macintosh; ..)
  • Response 헤더: 응답 정보, 예) Server: Apache
  • Entity 헤더: 엔티티 바디 정보, 예) Content-Type: text/html, Content-Length: 3423

HTTP BODY - message body - RFC2616(과거)

  • 메시지 본문(message body)은 엔티티 본문(entity body)을 전달하는데 사용
  • 엔티티 본문은 요청이나 응답에서 전달할 실제 데이터
  • 엔티티 헤더엔티티 본문의 데이터를 해석할 수 있는 정보 제공
    • 데이터 유형 Content-Type(html, json), 데이터 길이, 압축 정보 등등

그러나 2014년 RFC7230~7235 등장

RFC723x 변화

  • 엔티티(Entity) -> 표현(Representation)
  • Representation = representation Metadata + Representation Data
  • 표현 = 표현 메타데이터 + 표현 데이터

HTTP BODY - message body - RFC7230(최신)

  • 메시지 본문(message body)을 통해 표현 데이터 전달
  • 메시지 본문 = 페이로드(payload)
  • 표현은 요청이나 응답에서 전달할 실제 데이터
  • 표현 헤더는 표현 데이터를 해석할 수 있는 정보 제공
    • 데이터 유형(html, json), 데이터 길이, 압축 정보 등등
  • 참고: 표현 헤더는 표현 메타데이터와, 페이로드 메시지를 구분해야 하지만, 여기서는 생략

Representation 표현의 R이 REST의 R이다.

표현 Representation

  • Content-Type: 표현 데이터의 형식
  • Content-Encoding: 표현 데이터의 압축 방식
  • Content-Language: 표현 데이터의 자연 언어
  • Content-Length: 표현 데이터의 길이

표현 헤더는 전송, 응답 둘 다 사용

Content-Type 표현 데이터의 형식 설명

  • 미디어 타입, 문자 인코딩
    • text/html; charset=utf-8
    • application/json
    • image/png
    • ..

Content-Encoding 표현 데이터 인코딩

  • 표현 데이터를 압축하기 위해 사용
  • 데이터를 전달하는 곳에서 압축 후 인코딩 헤더 추가
  • 데이터를 읽는 쪽에서 인코딩 헤더의 정보로 압축 해제
    • gzip
    • deflate
    • identity

Content-Language 표현 데이터의 자연 언어

  • 표현 데이터의 자연 언어를 표현
    • ko
    • en
    • en-US

Content-Length 표현 데이터의 길이

  • 바이트 단위
  • Transfer-Encoding(전송 코딩)을 사용하면 Content-Length를 사용하면 안됨

협상(콘텐츠 네고시에이션)

클라이언트가 선호하는 표현 요청

  • Accept : 클라이언트가 선호하는 미디어 타입 전달
  • Accept-Charset : 클라이언트가 선호하는 문자 인코딩
  • Accept-Encoding : 클라이언트가 선호하는 압축 인코딩
  • Accept-Language : 클라이언트가 선호하는 자연 언어

협상 헤더는 요청 시에만 사용

Accept-Language 적용 전

한국어 브라우저 사용하고 세계적인 사이트에 들어갔는데, 이 사이트가 다중 언어를 지원하지만 기본 언어인 영어 먼저 보내버린다.

Accept-Language 적용 후

클라이언트가 한국어를 필요하다고 요청해서, 서버에선 한국어를 보냈다.

Accept-Language 복잡한 예시

독일 사이트를 들어갔고, 이 사이트는 독일어와 영어를 지원한다. 내 브라우저는 한국어를 요청했는데, 이 서버에서는 한국어가 없다.

그래서 기본 언어인 독일어를 보내버렸다. 이럴 때 영어를 받기 원하는데 어떻게 해야 할까?

협상과 우선순위 1 Quality Values(q)

  • Quality Values(q) 값 사용
  • 0~1, 클수록 높은 우선순위
  • 생략하면 1
  • Accept-Language: ko-KR,ko;q=0.9,en-US;q=0.8,en;q=0.7
      1. ko-KR;q=1 (q생략)
      1. ko;q=0.9
      1. en-US;q=0.8
      1. en;q=0.7

이제 한국어가 없는 사이트에서 영어를 보내준다.

애플에 들어가보면 다음과 같이 한국어, 영어 순으로 Accept-Language가 적용돼있다.

협상과 우선순위 2 Quality Values(q)

  • 구체적인 것이 우선한다.
  • Accept: text/*, text/plain, text/plain;format=flowed, */*
      1. text/plain;format=flowed
      1. text/plain
      1. text/*
      1. */*

협상과 우선순위 3 Quality Values(q)

  • 구체적인 것을 기준으로 미디어 타입을 맞춘다.
  • Accept: text/*;q=0.3, text/html;q=0.7, text/html;level=1, text/html;level=2;q=0.4, */*;q=0.5

진짜 다양한 Accept헤더가 있지만, 서버에서 이걸 지원해 줘야 제대로 작동한다.

전송 방식

  • Transfer-Encoding
  • Range, Content-Range

전송 방식 설명

  • 단순 전송
  • 압축 전송
  • 분할 전송
  • 범위 전송

단순 전송 Content-Length

압축 전송 Content-Encoding

바디에 넣는 값을 압축해서 용량을 줄였다. 하지만 가장 중요한 건 Content-Encoding 헤더를 꼭 같이 보내줘야 한다.

분할 전송 - Transfer-Encoding

Transfer-Encoding: chunked 헤더를 보내서 응답을 잘라서 보낸다.

이 때 중요한 건 Content-Length 헤더를 보내면 안된다.

범위 전송 Range, Content-Range

클라이언트가 이미 조금 데이터를 받았고, 중간에 잘린 걸 다시 받거나 할 때 범위를 지정해서 요청하고, 서버도 이에 따른 응답을 범위로 보낼 수 있다.

이 때 Content-Range를 사용한다.

일반 정보

  • From : 유저 에이전트의 이메일 정보
  • Referer : 이전 웹 페이지 주소
  • User-Agent : 유저 에이전트 애플리케이션 정보
  • Server : 요청을 처리하는 오리진 서버의 소프트웨어 정보
  • Date : 메시지가 생성된 날짜

From

  • 일반적으로 잘 사용되지 않음
  • 검색 엔진 같은 곳에서, 주로 사용
  • 요청에서 사용

Referer

  • 현재 요청된 페이지의 이전 웹 페이지 주소
  • A -> B로 이동하는 경우 B를 요청할 때 Referer: A 를 포함해서 요청
  • Referer를 사용해서 유입 경로 분석 가능
  • 요청에서 사용
  • 참고: referer는 단어 referrer의 오타

User-Agent

  • 클라이언트의 애플리케이션 정보(웹 브라우저 정보, 등등)
  • 통계 정보
  • 어떤 종류의 브라우저에서 장애가 발생하는지 파악 가능
  • 요청에서 사용

Server

  • Server: Apache/2.2.22 (Debian)
  • server: nginx
  • 응답에서 사용

Date

  • Date: Tue, 15 Nov 1994 08:12:31 GMT
  • 응답에서 사용

구글에 검색하고 개발자 도구 키면 다 볼 수 있다.

특별한 정보

  • Host: 요청한 호스트 정보(도메인)
  • Location: 페이지 리다이렉션
  • Allow: 허용 가능한 HTTP 메서드
  • Retry-After: 유저 에이전트가 다음 요청을 하기까지 기다려야 하는 시간

Host 요청한 호스트 정보(도메인)

  • 요청에서 사용
  • 필수 헤더
  • 하나의 서버가 여러 도메인을 처리해야 할 때
  • 하나의 IP 주소에 여러 도메인이 적용되어 있을 때

이렇게 Host 헤더가 있어야 어떤 서버에 접근 시켜줄지 알 수 있다.

Location 페이지 리다이렉션

  • 웹 브라우저는 3xx 응답의 결과에 Location 헤더가 있으면, Location 위치로 자동 이동 (리다이렉트)
  • 응답코드 3xx에서 설명
  • 201 (Created) : Location 값은 요청에 의해 생성된 리소스 URI
  • 3xx (Redirection) : Location 값은 요청을 자동으로 리디렉션 하기 위한 대상 리소스를 가리킴

Allow 허용 가능한 HTTP 메서드

  • 405 (Method Not Allowed) 에서 응답에 포함 해야 함
  • Allow: GET, HEAD, PUT

클라이언트한테 오류를 전송하면서 우리는 이런 메서드만 지원해 라고 보내줄 수 있다.

Retry-After 유저 에이전트가 다음 요청을 하기까지 기다려야 하는 시간

  • 503 (Service Unavailable): 서비스가 언제까지 불능인지 알려줄 수 있음
  • Retry-After : Fri, 31 Dec 1999 23:59:59 GMT (날짜 표기)
  • Retry-After : 120 (초 단위 표기)

인증

  • Authorization: 클라이언트 인증 정보를 서버에 전달
  • WWW-Authenticate: 리소스 접근 시 필요한 인증 방법 정의

Authorization

클라이언트 인증 정보를 서버에 전달

  • Authorization: Basic xxxxxxxxxxxxxxxx

oauth 등 사용하면 xxx자리에 값을 넣어준다.

WWW-Authenticate

  • 리소스 접근 시 필요한 인증 방법 정의
  • 401 Unauthorized 응답과 함께 사용
  • WWW-Authenticate: Newauth realm="apps", type=1, title="Login to \"apps\"", Basic realm="simple"

쿠키

  • Set-Cookie : 서버에서 클라이언트로 쿠키 전달(응답)
  • Cookie : 클라이언트가 서버에서 받은 쿠키를 저장하고, HTTP 요청 시 서버로 전달

쿠키나 다른 뭔가가 없을 때 로그인을 했다 쳐보자.

로그인 후 다시 첫 페이지를 가면 어떻게 될까?

서버는 어떻게 이 사용자가 로그인한 사용자인지 아닌지 구분할 수 있을까?

Stateless

  • HTTP는 무상태(Stateless) 프로토콜이다.
  • 클라이언트와 서버가 요청과 응답을 주고 받으면 연결이 끊어진다.
  • 클라이언트가 다시 요청하면 서버는 이전 요청을 기억하지 못한다.
  • 클라이언트와 서버는 서로 상태를 유지하지 않는다.

그럼 url에 모든 정보를 다 실어서 요청하면 될까?

보안도 별로고, 개발도 힘들다. 브라우저를 완전히 종료하고 다시 열면?

서버는 Set-Cookie로 사용자 정보를 헤더에 실어서 전달하고

웹 브라우저는 쿠키 저장소에 사용자 정보를 저장해버린다.

이제 서버는 쿠키만 보고 있고, 여기에 있으면 로그인 된 사용자니까 안녕하세요. 홍길동님이라고 응답을 보낼 수 있다.

모든 요청에 쿠키 정보 자동 포함된다.

  • 예) set-cookie: sessionId=abcde1234; expires=Sat, 26-Dec-2020 00:00:00 GMT; path=/; domain=.google.com; Secure
  • 사용처
    • 사용자 로그인 세션 관리
    • 광고 정보 트래킹
  • 쿠키 정보는 항상 서버에 전송됨
    • 네트워크 트래픽 추가 유발
    • 최소한의 정보만 사용(세션 id, 인증 토큰)
    • 서버에 전송하지 않고, 웹 브라우저 내부에 데이터를 저장하고 싶으면 웹 스토리지 (localStorage, sessionStorage) 참고.
  • 주의!
    • 보안에 민감한 데이터는 저장하면 안됨.(주민번호, 신용카드 번호 등등)

쿠키 - 생명주기

Expires, max-age

  • Set-Cookie: expires=Sat, 26-Dec-2020 04:39:21 GMT
    • 만료 일이 되면 쿠키 삭제
  • Set-Cookie: max-age=3600 (3600초)
    • 0이나 음수를 지정하면 쿠키 삭제
  • 세션 쿠키: 만료 날짜를 생략하면 브라우저 종료 시 까지만 유지
  • 영속 쿠키: 만료 날짜를 입력하면 해당 날짜까지 유지

쿠키 - 도메인

  • 예) domain=example.org
  • 명시: 명시한 문서 기준 도메인 + 서브 도메인 포함
    • domain=example.org를 지정해서 쿠키 생성
    • example.org는 물론이고 dev.example.org도 쿠키 접근
  • 생략: 현재 문서 기준 도메인만 적용
    • example.org 에서 쿠키를 생성하고 domain 지정을 생략
      • example.org 에서만 쿠키 접근
      • dev.example.org는 쿠키 미접근

쿠키 - 경로

  • 예) path=/home
  • 이 경로를 포함한 하위 경로 페이지만 쿠키 접근
  • 일반적으로 path=/ 루트로 지정
  • path=/home 지정
    • /home -> 가능
    • /home/level1 -> 가능
    • /home/level1/level2 -> 가능
    • /hello -> 불가능

쿠키 - 보안

  • Secure
    • 쿠키는 http, https를 구분하지 않고 전송
    • Secure를 적용하면 https인 경우에만 전송
  • HttpOnly
    • XSS 공격 방지
    • 자바스크립트에서 접근 불가(document.cookie)
    • HTTP 전송에만 사용
  • SameSite
    • XSRF 공격 방지
    • 요청 도메인과 쿠키에 설정된 도메인이 같은 경우만 쿠키 전송

댓글남기기