본문 바로가기
D.evelop [CS]/Multimedia System

[멀티미디어시스템] 3강 - 1.텍스트 - 표현

by Danne 2021. 7. 10.

문자 인코딩 : 모든 문자는 컴퓨터 내부에서 2진수 코드로 표현. 각각의 문자는 1개의 숫자로 할당

 

문자집합과 인코딩

문자 집합 : 표현해야 한 문자 정의와 순서 지정

코드화된 문자 집합 (CCS:Coded Character Set) : 문자 집합을 코드 형태로 표기

  • ASCII (American Standard Code for Information Interchange)
    • 영어 문자집합, 미국 표준
    • 가장 일반적인 형식
    • 알파벳, 숫자, 특수문자들이 7비트 2진수로 표현 (총 128개 문자 정의)
  • EBCDIC
    • IBM에서 대형 컴퓨터에 사용하기 위해 개발
    • 8비트 2진수
    • ASCII에 비해 두 배의 기호와 제어기능 표현
  • 서유럽 문자 집합 ( = ISO Latin-1 )
    • ASCII로 표현하기 부적한 유럽문자 지원을 위해 개발
    • 서유럽 문자들을 ASCII 코드에 포함
    • ASCII의 확장으로 8비트 코드
    • ISO : International Organization for Standardization (세계표준기구)
  • 한글 코드
    • 배경 : 영어, 유럽어 - 8비트 256개 코드로 표현 가능 / 한글 - 8비트로 모든 조합 불가능
    • 조합형 : 초, 중, 종성에 각 코드 할당
    • 완성형 : 완성형 문자에 코드 할당 (한국 표준안 : 모든 한글 표현 X, 통신에 문제가 적음)
      • 한국 표준 한글 규격 KSC5700
  • 유니코드 (unicode)
    • ASCll 표현의 한계로 인해 도입
    • 전 세계 언어를 표현할 수 있도록 설계된 산업 표준
    • 인코딩 방식 
      • UTF-8
        • ASCIl 코드 : 1바이트, 다른 문자 : 2바이트 이상
        • ASCII 코드와 호환
        • 한글 : 3바이트
      • UTF-16
        • 모든 문자 : 2바이트 
        • 글자 개수 제한 업음

 

마크업 텍스트 (mark-up text)

  • 특수문자를 삽입하여 문서의 서식 작성 지정, 구조적 경계를 밝히는 표현법
  • 마크업 정보가 들어가 있는 텍스트
    • 문서 내용 외의 문서 서식 지정, 찾아보기 지정 등 다른 문서와 연결 방법을 지정해 컴퓨터에게 지시
  • 마크업 markup
    • 문서 구조 정의, 표현하기 위해 정의된 부가 정보
    • 대표 : HTML, SGML

 

구조적 테스트

  • 프로세싱 지향적
  • 문서의 논리적 구조설계적 구조를 표현하는 데이터 구조로 이용
    • 선형의 순차적인 구조 : 데이터 구조의 트리 형태와 같음
    • 타이틀, 절 , 단락 / 페이지, 블록, 열 단위로 내려감
    • 독점적인 표현방식
  • ODA(Office Document Architecture) : 논리적 구조와 설계 구성요소들의 구성과 관계를 명시하는 국제 표준
    • 서로 다른 기종들 간의 문서교환이 용이하도록 하는 역할

하이퍼텍스트

  • 여러 개의 연결된 문서라는 의미
  • 비순차적인 전개원리
  • 서로 다른 문서의 특정 위치로 연결
  • 비선형 그래프와 같은 구조
  • 노드(node)는 텍스트의 작은 '덩어리'로 링크(link)로 연결

 

 

 

 

내용 출처

-      

한국방송통신대학교

"멀티미디어시스템" 강의 및 교재



반응형

댓글