문자 인코딩 : 모든 문자는 컴퓨터 내부에서 2진수 코드로 표현. 각각의 문자는 1개의 숫자로 할당
문자집합과 인코딩
문자 집합 : 표현해야 한 문자 정의와 순서 지정
코드화된 문자 집합 (CCS:Coded Character Set) : 문자 집합을 코드 형태로 표기
- ASCII (American Standard Code for Information Interchange)
- 영어 문자집합, 미국 표준
- 가장 일반적인 형식
- 알파벳, 숫자, 특수문자들이 7비트 2진수로 표현 (총 128개 문자 정의)
- EBCDIC
- IBM에서 대형 컴퓨터에 사용하기 위해 개발
- 8비트 2진수
- ASCII에 비해 두 배의 기호와 제어기능 표현
- 서유럽 문자 집합 ( = ISO Latin-1 )
- ASCII로 표현하기 부적한 유럽문자 지원을 위해 개발
- 서유럽 문자들을 ASCII 코드에 포함
- ASCII의 확장으로 8비트 코드
- ISO : International Organization for Standardization (세계표준기구)
- 한글 코드
- 배경 : 영어, 유럽어 - 8비트 256개 코드로 표현 가능 / 한글 - 8비트로 모든 조합 불가능
- 조합형 : 초, 중, 종성에 각 코드 할당
- 완성형 : 완성형 문자에 코드 할당 (한국 표준안 : 모든 한글 표현 X, 통신에 문제가 적음)
- 한국 표준 한글 규격 KSC5700
- 유니코드 (unicode)
- ASCll 표현의 한계로 인해 도입
- 전 세계 언어를 표현할 수 있도록 설계된 산업 표준
- 인코딩 방식
- UTF-8
- ASCIl 코드 : 1바이트, 다른 문자 : 2바이트 이상
- ASCII 코드와 호환
- 한글 : 3바이트
- UTF-16
- 모든 문자 : 2바이트
- 글자 개수 제한 업음
- UTF-8
마크업 텍스트 (mark-up text)
- 특수문자를 삽입하여 문서의 서식 작성 지정, 구조적 경계를 밝히는 표현법
- 마크업 정보가 들어가 있는 텍스트
- 문서 내용 외의 문서 서식 지정, 찾아보기 지정 등 다른 문서와 연결 방법을 지정해 컴퓨터에게 지시
- 마크업 markup
- 문서 구조 정의, 표현하기 위해 정의된 부가 정보
- 대표 : HTML, SGML
구조적 테스트
- 프로세싱 지향적
- 문서의 논리적 구조와 설계적 구조를 표현하는 데이터 구조로 이용
- 선형의 순차적인 구조 : 데이터 구조의 트리 형태와 같음
- 타이틀, 절 , 단락 / 페이지, 블록, 열 단위로 내려감
- 독점적인 표현방식
- ODA(Office Document Architecture) : 논리적 구조와 설계 구성요소들의 구성과 관계를 명시하는 국제 표준
- 서로 다른 기종들 간의 문서교환이 용이하도록 하는 역할
하이퍼텍스트
- 여러 개의 연결된 문서라는 의미
- 비순차적인 전개원리
- 서로 다른 문서의 특정 위치로 연결
- 비선형 그래프와 같은 구조
- 노드(node)는 텍스트의 작은 '덩어리'로 링크(link)로 연결
내용 출처
-
한국방송통신대학교
"멀티미디어시스템" 강의 및 교재
반응형
'D.evelop [CS] > Multimedia System' 카테고리의 다른 글
[멀티미디어시스템] 8강 - 1.디지털 이미지 압축 (0) | 2021.07.11 |
---|---|
[멀티미디어시스템] 7강 - 1.데이터 압축 (0) | 2021.07.11 |
[멀티미디어시스템] 5강 - 2.그래픽, 파일 형식 (0) | 2021.07.10 |
[멀티미디어시스템] 5강 - 1.이미지 (0) | 2021.07.10 |
[멀티미디어시스템] 3강 - 2. 텍스트 - 파일형식, 전자출판 (0) | 2021.07.10 |
댓글