본문 바로가기
CTF/Dreamhack

[Dreamhack] System Hacking STAGE 2 - Linux Memory Layout

by 8희 2022. 10. 5.

리눅스 프로세스의 메모리 구조

세그먼트

- 리눅스에서는 프로세스의 메모리를 크게 5가지의 세그먼트(segment)로 구분

- 세그먼트란 적재되는 데이터의 용도별로 메모리의 구획을 나눈 것

- 세그먼트는 크게 코드 세그먼트, 데이터 세그먼트, BSS 세그먼트, 힙 세그먼트, 그리고 스택 세그먼트로 구분

 

 

- 운영체제가 메모리를 용도별로 나누면, 각 용도에 맞게 적절한 권한을 부여할 수 있다는 장점이 있다. 

- 권한은 읽기, 쓰기, 실행이 존재하며, CPU는 메모리에 대해 권한이 부여된 행위만 할 수 있다.

 

코드 세그먼트

- 코드 세그먼트(Code Segment) = 텍스트 세그먼트 (Text Segment)

- 코드 세그먼트란 실행 가능한 기계 코드가 위치하는 영역

 

- 프로그램이 동작하려면 코드를 실행할 수 있어야 하므로 이 세그먼트에는 읽기 권한과 실행 권한부여

- 쓰기 권한이 있으면 공격자가 악의적인 코드를 삽입하기가 쉬워지므로, 대부분의 현대 운영체제는 이 세그먼트에 쓰기 권한 제거

 

int main() { return 31337; }

- 정수 31337을 반환하는 main함수가 컴파일 되면 554889e5b8697a00005dc3라는 기계 코드로 변환

- 이 기계 코드가 코드 세그먼트에 위치

 

데이터 세그먼트

- 데이터 세그먼트(Data Segment)에는 컴파일 시점에 값이 정해진 전역 변수 및 전역 상수들이 위치

- CPU가 이 세그먼트의 데이터를 읽을 수 있어야 하므로, 읽기 권한이 부여

 

- 데이터 세그먼트는 쓰기가 가능한 세그먼트와 쓰기가 불가능한 세그먼트로 다시 분류

 

- 쓰기가 가능한 세그먼트는 전역 변수와 같이 프로그램이 실행되면서 값이 변할 수 있는 데이터들이 위치

- 이런 세그먼트는 data 세그먼트

 

- 쓰기가 불가능한 세그먼트에는 프로그램이 실행되면서 값이 변하면 안되는 데이터들이 위치

- 전역으로 선언된 상수가 여기에 포함

- 이런 세그먼트를 rodata(read-only data) 세그먼트 

 

int data_num = 31337;                       // data
char data_rwstr[] = "writable_data";        // data
const char data_rostr[] = "readonly_data";  // rodata
char *str_ptr = "readonly";  // str_ptr은 data, 문자열은 rodata
int main() { ... }

- 데이터 세그먼트에 포함되는 여러 데이터의 유형

- 주의 깊게 살펴봐야할 변수는 str_ptr

- str_ptr은 “readonly”라는 문자열을 가리키고 있는데, 이 문자열은 상수 문자열로 취급되어 rodata에 위치하며, 이를 가리키는 str_ptr은 전역 변수로서 data에 위치

 

BSS 세그먼트

- BSS 세그먼트(BSS Segment, Block Started By Symbol Segment)는 컴파일 시점에 값이 정해지지 않은 전역 변수가 위치하는 메모리 영역

- 개발자가 선언만 하고 초기화하지 않은 전역변수 등이 포함

- 이 세그먼트의 메모리 영역은 프로그램이 시작될 때, 모두 0으로 값이 초기화

- 이런 특성 때문에 C 코드를 작성할 때, 초기화되지 않은 전역 변수의 값은 0이 된다. 

 

- 이 세그먼트에는 읽기 권한 및 쓰기 권한이 부여

 

int bss_data;
int main() {
  printf("%d\n", bss_data);  // 0
  return 0;
}

- 아래 코드에서 초기화되지 않은 전역 변수인 bss_data가 BSS 세그먼트에 위치

 

스택 세그먼트

- 스택 세그먼트(Stack Segment)는 프로세스의 스택이 위치하는 영역

- 함수의 인자나 지역 변수와 같은 임시 변수들이 실행중에 여기에 저장

- 스택 세그먼트는 스택 프레임(Stack Frame)이라는 단위로 사용

- 스택 프레임은 함수가 호출될 때 생성되고, 반환될 때 해제

- 그런데 프로그램의 전체 실행 흐름은 사용자의 입력을 비롯한 여러 요인에 영향을 받는다.

 

void func() {
  int choice = 0;
  scanf("%d", &choice);
  if (choice)
    call_true();
  else
    call_false();
  return 0;
}

- 코드에서는 지역변수 choice가 스택에 저장된다.

 

- 코드에서 유저가 입력한 choice에 따라 call_true()가 호출될 수도, call_false()가 호출될 수도 있다.

- 즉 어떤 프로세스가 실행될 때, 이 프로세스가 얼마 만큼의 스택 프레임을 사용하게 될 지를 미리 계산하는 것은 일반적으로 불가능

- 운영체제는 프로세스를 시작할 때 작은 크기의 스택 세그먼트를 먼저 할당해주고, 부족해 질 때마다 이를 확장해준다.

 

- 스택에 대해서 ‘아래로 자란다'라는 표현을 종종 사용하는데, 이는 스택이 확장될 때, 기존 주소보다 낮은 주소로 확장되기 때문!

 

- 이 영역에는 CPU가 자유롭게 값을 읽고 쓸 수 있어야 하므로, 읽기 쓰기 권한이 부여

 

힙 세그먼트

- 힙 세그먼트(Heap Segment)는 힙 데이터가 위치하는 세그먼트

- 스택과 마찬가지로 실행중에 동적으로 할당될 수 있으며, 리눅스에서는 스택 세그먼트와 반대 방향으로 자란다.

 

- C언어에서 malloc(), calloc() 등을 호출해서 할당받는 메모리가 이 세그먼트에 위치

- 일반적으로 읽기 쓰기권한이 부여

int main() {
  int *heap_data_ptr =
      malloc(sizeof(*heap_data_ptr));  // 동적 할당한 힙 영역의 주소를 가리킴
  *heap_data_ptr = 31337;              // 힙 영역에 값을 씀
  printf("%d\n", *heap_data_ptr);  // 힙 영역의 값을 사용함
  return 0;
}

- 예제 코드는 heap_data_ptr에 malloc()으로 동적 할당한 영역의 주소를 대입하고, 이 영역에 값을 쓴다.

- heap_data_ptr은 지역변수이므로 스택에 위치하며, malloc으로 할당받은 힙 세그먼트의 주소를 가리킨다. 

 

* 힙과 스택 세그먼트가 자라는 방향이 반대인 이유

- 두 세그먼트가 동일한 방향으로 자라며, 연속된 메모리 주소에 각각 할당된다고 가정

- 이 경우, 기존의 힙 세그먼트를 모두 사용하고 나면, 이를 확장하는 과정에서 스택 세그먼트와 충돌하게 된다.

- 이를 쉽게 해결하기 위해 리눅스는 스택을 메모리의 끝에 위치시키고, 힙과 스택을 반대로 자라게 한다.

- 이렇게 하면 힙과 스택은 메모리를 최대한 자유롭게 사용할 수 있으며, 충돌 문제로 부터도 비교적 자유롭게 된다.