[컴퓨터 구조] 2. 데이터
[컴퓨터 구조] 2. 데이터
Chapter2 데이터
2-1 0과 1로 숫자를 표현하는 방법
- 비트 : 0과 1을 표현할 수 있는 가장 작은 정보 단위
- 바이트 : 8개의 비트를 묶은 단위
- 워드 : CPU가 한번에 처리할 수 있는 데이터 크기
- 이진법 : 0과 1만으로 모든 숫자를 표현 (십진수와의 구분을 위해 이진수 앞에 0b를 붙임)
- 이진수의 음수 표현 : 가장 널리 사용되는 방법은 2의 보수
- 2의 보수 : 어떤 수를 그보다 큰 2^n에서 뺀 값
- 모든 0과 1을 뒤집고 거기에 1을 더한 값
- 플래그 : 양수인지 음수인지 구분
- 십육진법 : 0 1 2 3 4 5 6 7 8 9 A B C D E F 10 11…
- 십육진수 → 이진수
- 십육진수 한 글자를 4비트의 이진수로 간주
- 이진수 → 십육진수
- 이진수 숫자를 네 개를 십육진수 한 글자로 간주
2-1 0과 1로 문자를 표현하는 방법
- 문자 집합 : 컴퓨터가 인식하고 표현할 수 있는 문자의 모음
- 문자 인코딩 : 문자를 0과 1로 변환하는 과정 ↔ 문자 디코딩
- 아스키 : 초창기 문자 집합 중 하나, 영어 알파벳과 아라비아 숫자, 일부 특수 문자 포함, 7비트로 표현(2^7 = 128)
- 한글은 각 음절 하나하나가 초성, 중성, 종성의 조합으로 이루어짐 → 2가지 인코딩 방식 존재
- 완성형 인코딩
- 조합형 인코딩
- EUC-KR : 한글을 2바이트 크기로 인코딩할 수 있는 완성형 인코딩 방식(모든 한글을 표현할 수는 없다는 한계)
- 유니코드 : 한글을 포함한 대부분 나라의 문자, 특수문자, 이모티콘까지 코드로 표현할 수 있는 통일된 문자 집합
- UTF-8, UTF-16, UTF-32, 는 유니코드 문자의 인코딩 방식
혼자 공부하는 컴퓨터구조 + 운영체제를 통해 진행한 스터디를 정리한 내용입니다.
문제가 될시에는 수정 혹은 삭제하겠습니다.
This post is licensed under CC BY 4.0 by the author.