Post

[컴퓨터 구조] 2. 데이터

[컴퓨터 구조] 2. 데이터

Chapter2 데이터


2-1 0과 1로 숫자를 표현하는 방법

  • 비트 : 0과 1을 표현할 수 있는 가장 작은 정보 단위
  • 바이트 : 8개의 비트를 묶은 단위
  • 워드 : CPU가 한번에 처리할 수 있는 데이터 크기

image

  • 이진법 : 0과 1만으로 모든 숫자를 표현 (십진수와의 구분을 위해 이진수 앞에 0b를 붙임)
  • 이진수의 음수 표현 : 가장 널리 사용되는 방법은 2의 보수
    • 2의 보수 : 어떤 수를 그보다 큰 2^n에서 뺀 값
    • 모든 0과 1을 뒤집고 거기에 1을 더한 값
  • 플래그 : 양수인지 음수인지 구분
  • 십육진법 : 0 1 2 3 4 5 6 7 8 9 A B C D E F 10 11…
  • 십육진수 → 이진수
    • 십육진수 한 글자를 4비트의 이진수로 간주
  • 이진수 → 십육진수
    • 이진수 숫자를 네 개를 십육진수 한 글자로 간주

2-1 0과 1로 문자를 표현하는 방법

  • 문자 집합 : 컴퓨터가 인식하고 표현할 수 있는 문자의 모음
  • 문자 인코딩 : 문자를 0과 1로 변환하는 과정 ↔ 문자 디코딩
  • 아스키 : 초창기 문자 집합 중 하나, 영어 알파벳과 아라비아 숫자, 일부 특수 문자 포함, 7비트로 표현(2^7 = 128)
  • 한글은 각 음절 하나하나가 초성, 중성, 종성의 조합으로 이루어짐 → 2가지 인코딩 방식 존재
    • 완성형 인코딩
    • 조합형 인코딩

image

  • EUC-KR : 한글을 2바이트 크기로 인코딩할 수 있는 완성형 인코딩 방식(모든 한글을 표현할 수는 없다는 한계)
  • 유니코드 : 한글을 포함한 대부분 나라의 문자, 특수문자, 이모티콘까지 코드로 표현할 수 있는 통일된 문자 집합
    • UTF-8, UTF-16, UTF-32, 는 유니코드 문자의 인코딩 방식

혼자 공부하는 컴퓨터구조 + 운영체제를 통해 진행한 스터디를 정리한 내용입니다.
문제가 될시에는 수정 혹은 삭제하겠습니다.

This post is licensed under CC BY 4.0 by the author.