본문 바로가기
컴퓨터공학/멀티미디어개론

11. 오디오와 멀티미디어

by meow0110 2024. 7. 3.

■ 사운드와 오디오 차이 : 오디오는 녹음된 것을 뜻함. 즉 사운드를 디지털과 같은 저장매체에 저장하면 오디오가 된다고 생각하면 된다.

 

■ 음파의 반사 흡수 굴절 : 소리 100이 있을 때, 반사가 되면 100이 반사가 되는 것이 아닌, 물체가 흡수하는 양도 있다. 이러한 양 때문에 에너지가 소모되면서 소리가 60만 들리게 되는 것이라 생각하면 된다.

 

 

 

■ 리듬 (Rhythm) : 
음악의 구조를 만드는 요소 
박자, 템포(tempo) 등으로 표현

■ 멜로디 (Melody) : 

- 음높이의 시간에 따른 변화

- 음높이 : 도 와 솔의 음높이의 차이라고 생각하면 된다. 

 

■ 하모니 (Harmony) : 두 개 이상 음이 동시에 표현되는 화음

 

■  음성의 높이 : 도 보다 솔이 음성의 높이가 높다.

■ 음색 (timbre=템버) 

 

 

■ 주파수 : 소리의 높낮이 / 헤르츠 / 인간의 가청 주파수 20~20kHz

■ 진폭 : 소리의 크기 

■ 음색 : 소리의 색 / 템버 

 

■ 음고 

- 주파수와 음고의 차이 : 둘다 소리의 높고 낮음인데? 차이가 뭘까?  음파에서는 주파수 / 소리에서는 음고  라고 부름.

 

■ 진폭 : 단위는 와트  

- 진폭과 세기의 차이 : 음파에서는 진폭 / 소리에서는 세기

- 소리의 강도로 표현할때는 와트가 아닌 데시벨 dB로 표현

 

■ a

- 진폭이 낮다. 그래서 약함 (안들려! 왜이렇게 목소리가 작아!)

 

■ b

- 진폭이 높다. 그래서 강한 소리 (시끄러운 큰 소리)

 

■ c 

- 음고가 높다. 고음의 소리. 

- a와 비교한다면, a는 소리가 저음. c는 소리가 고음! (소프라노같이 높은 소리)

 

■ d

- 한마디로 고음의 엄청난 소리를 아주 크게 들려주는 모습이다. 

 

■ 직접음 : 직접 들음

■ 반사파 :  소리 시작 > 산란 > 반사된 소리 > 이걸 들음 

■ 잔향 : 1차 반향음 > 들음 (반사되서 오기에 늦음. 그리고 이미 음원의 소리는 끝남.)

 

■ 백색소음 : ASMR이 대표적인 예.

■ 사운드 마스킹 : 소리로 다른 소리를 덮음. 

 

■ 축음기 : 잠깐의 소리만 녹음

■ LP 레코드 : 긴 소리 녹음.  저장용량 한계, 가운데 판 열화 등 발생해서 CD, MP3등이 나옴.

 

■ D/A  : 디지털을 아날로그로 출력

 

 

■ 미디 : 디지털 신호를 상호 교환하기 위한 프로토콜임을 기억하자.

 

■ ADC (아날로그 디지털 컨버터) : 표본화 > 양자화 > 부호화

■ DAC (디지털 아날로그 컨버터) : 아날로그로 복호화

 

■ ADC 에서 일어남. 즉 아날로그 > 디지털 과정에서 일어나는 신호의 변조 과정

 

■ 표본화 = 샘플링

신호값 하나하나를 일정한 시간 간격마다 표본화함. 위의 오른쪽 도표처럼.

 

■ 표본화 : 주파수 단위인 Hz로 표현.

■ 아래  그래프 사진 

- 왼쪽은 표본이 많다. 그래서 원래음질과 비슷하다. 즉 표본화 비율이 높을수록 음질이 본래와 흡사하다. 대신 저장공간을 많이 차지할 것이다. (샘플링 수가 많으니까!)

- 오른쪽은 -1. 0 . 1  이런식으로 단순하다. 즉 표본화가 적다. 그래서 실제로는 받은 음질 데이터가 왜곡될 수 도 있다.

 

■ 나이키스트 규정

- 최고 주파수의 2배 이상의 속도로 표본화 하면 된다. 그런데 2배로 하면 대칭성 등의 문제가 발생한다.

- 그래서 그것보다 10%의 오차 범위 등을 고려한다. 

- 결론은 CD는 44.1kHz / DVD는 48kHz로 저장하면, 자연스러운 음질을 들을 수 있다 생각하자. 

 

■ 양자화

 

■ 양자화 에러 : 음질 데이터의 계단 현상이 나타나면서 문제가 발생함을 뜻함.

 

■ 부호화 :

- 자주 발생하는 숫자는 짧은 비트, 덜 발생하는 숫자는 긴 비트로 저장해서 파일 크기 용량을 줄임

 

 

■ 디지털 오디오의 저장과 압축 

■ 웨이브 : 무압축 형식. 파일크기가 가장 크다. 

■미디 : 전자 악기의 신호만 저장. 파일 크기가 가장 작음. a악기에서 저장한걸 b악기에서 재생하면 서로 다른 재생 결과 나옴.

 

 

■ mp3 : 손실이 어느정도 발생. 하지만 압축률이 높음.

■ AAC : 오디오 코덱의 한종류. mp3보다 좀 더 좋음.

 

■ 아래 그래프

- 양자화 비트도 늘리면서 주파수까지 늘린 모습이다.

- b(24비트)는 a(16비트)보다 비트수가 많다. 그래서 블럭이 좀 더 많고, 그만큼 음원이 좋다.

- c(24비트)는 24비트인건 b와 동일하다. 하지만 주파수가 2배이상 높다. 샘플링 레이트가 높기 때문에 표본을 더 따왔다. 즉 촘촘하게 표현을 하고 있기 때문에 음질이 훨씬 더 좋다. (원음을 최대한 보존)

 

■ 초당 전송량 공식에서 : 왜 마지막 8비트로 나누는가? 1바이트가 8비트이기 때문.

■ 스트레오 저장 시 : 2ch이기 때문에 2를 곱한다. 즉 이게 모드이다.

 

 

■ 잡음

 

■ 샘플링 레이트가 낮을 경우 나타남. 

■ LPF 를 통해 해결

■ 양자화 비트로 표현할 때, 오차가 크게 발생하기 때문에 들리는 부자연스러운 소리.

 

 

■ 파형이 잘려서 생기는 것.

- 3번째 그래프 언덕(Clipping이라 적힌 곳)을 보자. 

- 최대 +12까지만 나타낼수 있는데, 파형이 그이상 나온다. 즉 진폭이 너무 높아서 +12까지 표현이 안된다.

- 때문에 파형이 잘려서 생기는 문제가 클리핑이다.

 

■ 정규화

- 높이를 모두 균일하게 맞춰주는 작업.

 

■ 지터에러 

- 시간적 위치는 위상(phase)이라고 함.

- 기기 간의 저항 : 모든 기기에는 허수 저항, 실수저항이 있다. 지터에러는 허수저항에 의해 발생함.

- 기기 간의 저항으 맞춰줘야 한다. 혹은 짧은 케이블로 연결하면 된다.

 

 

 

  학습정리

1. 오디오의 관련 기술

  • 음성 인식(Voice Recognition): 사람의 억양이나 말하는 습관에 따른 정보 인식
  • 음성 합성(Voice Synthesis): 문장을 작성하면 음성 합성기가 그대로 읽어내는 기술

 

2. 아날로그와 디지털

1) 아날로그 오디오 (Analog Audio)

  • 1877년 에디슨이 발명한 축음기로부터 시작
  • 1948년 LP 레코드 개발
  • 1984년 CD, 1995년 MP3 등으로 디지털로 변환

2) 디지털 오디오 (Digital Audio)

  • 아날로그 파형을 A/D 변환 장치를 이용하여 0과 1로 구성된 디지털 데이터로 변환하여 저장한 소리
  • D/A 변환 장치를 이용하여 아날로그 사운드로 출력

 

3. 잡음(Noise)

1) 잡음의 발생

  • 디지털 사운드로 변환하는 과정이나 사운드를 가공 및 처리하는 과정에서 잡음 발생 가능

2) 잡음의 종류

  • 표본화 잡음
  • 양자화 잡음
  • 클리핑 (clipping)
  • 지터 에러 (jitter error)