MP3 음질

mp3

1. 휴대용 MP3 플레이어의 일반적인 이름.

MP3 형식의 음악을 재생하는 데 사용되는 유형(이제 wma, wav 및 기타 형식과 호환 가능) 휴대용 MP3 플레이어는 원래 1997년 한국인 황문&황에 의해 발명되었으며 관련 특허를 출원했습니다.

2.MP3를 음악 형식으로 사용

p>

MPEG-1 MP3라고도 하는 오디오 레이어 3은 오늘날 가장 많이 사용되는 디지털 오디오 인코딩 및 손실 압축 형식 중 하나입니다. 이는 오디오 데이터의 양을 크게 줄이도록 설계되었으며 대부분의 사용자에게 재생되는 사운드에는 큰 저하가 없습니다. 압축되지 않은 원본 오디오와 비교한 품질입니다. 이는 독일 에를랑겐에 본사를 둔 연구 기관인 Fraunhofer-Gesellschaft의 엔지니어 팀에 의해 1991년에 발명되고 표준화되었습니다.

개요

MP3는 데이터 압축 형식입니다. 사람의 청각에 중요하지 않은 PCM(펄스 코드 변조) 오디오 데이터에서 데이터를 삭제하므로(손실이 많은 이미지 압축인 JPEG와 유사) 파일 크기가 훨씬 작아집니다.

MP3에서는 오디오의 어느 부분을 삭제할 수 있는지 결정하기 위해 음향심리학을 비롯한 다양한 기술이 사용됩니다. MP3 오디오는 다양한 비트 전송률로 압축할 수 있으므로 데이터 크기와 음질 간에 다양한 균형을 이룰 수 있습니다.

MP3 형식은 하이브리드 변환 메커니즘을 사용하여 시간 도메인 신호를 주파수 도메인 신호로 변환합니다.

* 32밴드 다상 적분 필터(PQF)

* 36 또는 12탭 수정 이산 코사인 필터(MDCT), 각 하위 대역 크기는 0~1~2~31 사이에서 독립적으로 선택 가능

* 앨리어싱 감쇠 후처리

p>

다른 형식을 만들고 홍보하기 위한 많은 중요한 노력이 있지만 MPEG 사양에 따르면 MPEG-4의 AAC(고급 오디오 코딩)는 차세대 MP3 형식이 될 것입니다. 그러나 MP3의 전례 없는 인기로 인해 현재 다른 형식의 성공 가능성은 거의 없습니다. MP3는 광범위한 클라이언트 소프트웨어 지원뿐만 아니라 휴대용 미디어 플레이어(MP3 플레이어), DVD 및 CD 플레이어와 같은 많은 하드웨어 지원도 제공합니다.

역사

개발

MPEG-1 오디오 레이어 2 인코딩은 독일의 Deutsche Forschungs- und Versuchsanstalt für Luft- und Raumfahrt(나중에 Deutsches Zentrum für로 불림)로 시작되었습니다. Luft- und Raumfahrt, 독일 우주 센터) Egon Meier-Engelen이 관리하는 DAB(디지털 오디오 방송) 프로젝트. 이 프로젝트는 유럽연합(EU)의 EUREKA 연구 프로젝트로 자금을 지원받고 있으며, 그 이름은 일반적으로 EU-147로 불린다. EU-147의 연구기간은 1987년부터 1994년까지이다.

1991년에는 Musicam(Layer 2라고 함)과 ASPEC(Adaptive Spectrum Sensing Entropy Coding)라는 두 가지 제안이 나타났습니다. 네덜란드 회사 Philips, 프랑스 CCETT 및 독일 Institut für Rundfunktechnik이 제안한 Musicam 방법은 단순성, 오류에 대한 견고성 및 고품질 압축에 대한 낮은 계산 노력으로 인해 선택되었습니다. 서브밴드 코딩을 기반으로 하는 Musicam 형식은 MPEG 오디오 압축 형식(샘플링 속도, 프레임 구조, 데이터 헤더, 프레임당 샘플링 지점)을 결정하는 핵심 요소입니다. 이 기술과 그 디자인 아이디어는 ISO MPEG 오디오 레이어 I, II 및 이후 레이어 III(MP3) 형식의 정의에 완전히 통합되었습니다. Mussmann 교수(하노버 대학교)의 주도 하에 Leon van de Kerkhof(Layer I)와 Gerhard Stoll(Layer II)이 표준 제정을 완료했습니다.

네덜란드의 Leon Van de Kerkhof, 독일의 Gerhard Stoll, 프랑스의 Yves-François Dehery, 독일의 Karlheinz Brandenburg로 구성된 워킹 그룹은 Musicam과 ASPEC의 디자인 아이디어를 흡수하고 자체 디자인을 추가했습니다. 이로 인해 128kbit/s에서 MP2 192kbit/s 음질을 달성할 수 있는 MP3가 개발되었습니다.

이 모든 알고리즘은 결국 1992년 MPEG의 첫 번째 표준 그룹인 MPEG-1의 일부가 되었고, 1993년에 발표된 국제 표준 ISO/IEC 11172-3을 생성했습니다. MPEG 오디오에 대한 추가 작업은 결국 1994년에 공식화된 두 번째 MPEG 표준 그룹인 MPEG-2 표준의 일부가 되었습니다. 이 표준의 공식 명칭은 1995년에 처음 발표된 ISO/IEC 13818-3입니다.

인코더의 압축 효율성은 일반적으로 비트 전송률로 정의됩니다. 압축률은 비트 수(:비트 깊이)와 입력 신호의 샘플링 속도에 따라 달라지기 때문입니다. 하지만 CD 파라미터(44.1kHz, 2채널, 채널당 16비트, 2x16비트)를 압축률 레퍼런스로 사용하는 제품이 종종 있는데, 이 레퍼런스를 사용한 압축률이 일반적으로 더 높으며, 이는 압축률이 더 높다는 것을 보여줍니다. 압축 관련 손실 문제에 매우 중요합니다.

Karlheinz Brandenburg는 CD 미디어에 있는 Suzanne Vega의 노래인 Tom's Diner를 사용하여 MP3 압축 알고리즘을 평가했습니다. 이 곡을 사용한 이유는 곡의 부드럽고 단순한 멜로디가 재생 시 압축된 형식의 결함을 더 쉽게 들을 수 있기 때문입니다. 어떤 사람들은 농담으로 Suzanne Vega를 "MP3의 어머니"라고 부릅니다. EBU V3/SQAM 참조 CD의 보다 진지하고 중요한 오디오 선택(글로켄슈필, 삼각형, 아코디언 등)은 전문 오디오 엔지니어가 MPEG 오디오 형식의 주관적인 인식 품질을 평가하는 데 사용됩니다.

MP3가 대중에게 공개됩니다

비트 호환 MPEG 오디오 파일(레이어 1, 레이어 2, 레이어 3)을 생성하기 위해 ISO MPEG 오디오 위원회 회원들은 소프트웨어를 개발했습니다. 11172-5에 대한 C 언어 참조 시뮬레이션 소프트웨어에서는 ISO라고 합니다. 일부 비실시간 운영 체제에서 압축 오디오에 대한 최초의 DSP 기반 실시간 하드웨어 디코딩을 시연할 수 있습니다. 소비자 수신기 및 셋톱박스용 디지털 방송(라디오 DAB 및 TV DVB)에 사용하기 위해 여러 다른 MPEG 오디오 버전이 실시간으로 개발되었습니다.

나중에 1994년 7월 7일 Fraunhofer-Gesellschaft는 l3enc라는 최초의 MP3 인코더를 출시했습니다.

프라운호퍼 개발팀은 1995년 7월 14일에 .mp3 확장자를 선택했습니다(이전 확장자는 .bit였습니다). 최초의 실시간 소프트웨어 MP3 플레이어인 Winplay3(1995년 9월 9일 출시)를 사용하여 많은 사람들이 개인용 컴퓨터에서 MP3 파일을 인코딩하고 재생할 수 있었습니다. 당시 하드 드라이브는 상대적으로 작았기 때문에(예: 500MB) 이 기술은 엔터테인먼트 음악을 컴퓨터에 저장하는 데 매우 중요했습니다.

MP2, MP3 및 인터넷

1993년 10월 MP2(MPEG-1 Audio Layer 2) 파일이 인터넷에 등장했으며 Xing MPEG 오디오 플레이어를 사용하여 재생되는 경우가 많았습니다. 나중에 Tobias Bading이 Unix용으로 개발한 MAPlay가 등장했습니다. MAPlay는 1999년 2월 22일에 처음 출시되었으며 현재 Microsoft Windows 플랫폼으로 포팅되었습니다.

처음에는 MP2 인코더 제품은 Xing Encoder와 CDDA2WAV뿐이었습니다. CDDA2WAV는 CD 오디오 트랙을 WAV 형식으로 변환하는 CD 리퍼입니다.

IUMA(Internet Underground Music Archive)는 종종 온라인 음악 혁명의 창시자로 간주됩니다. IUMA는 MP3와 MP3가 출시되기 이전에 수천 개의 라이선스가 부여된 MP2 노래를 보유한 인터넷 최초의 음악 웹사이트였습니다. 인터넷 녹음이 인기를 얻었습니다.

1995년 상반기부터 1990년대 후반까지 MP3는 인터넷에서 번창하기 시작했습니다. MP3의 인기는 주로 1997년 널소프트(Nullsoft)가 출시한 윈앰프(Winamp)와 1999년 냅스터(Napster)가 출시한 냅스터(Napster) 등 기업과 소프트웨어 패키지의 성공에 힘입어 서로의 발전을 촉진해왔다. 이 프로그램을 사용하면 일반 사용자가 MP3 파일을 쉽게 재생, 생성, 공유 및 수집할 수 있습니다.

MP3 파일의 P2P 기술 파일 공유에 대한 논쟁은 최근 몇 년간 급속히 확산되었습니다. 이는 주로 압축을 통해 파일 공유가 가능하고 압축되지 않은 파일은 크기가 너무 커서 공유할 수 없기 때문입니다. **즐기세요. 인터넷을 통한 MP3 파일의 대규모 배포로 인해 일부 주요 음반사에서는 저작권을 보호하기 위해 Napster를 상대로 법적 조치를 취했습니다(지적 재산권 참조).

iTunes Music Store와 같은 상업용 온라인 음악 배포 서비스에서는 일반적으로 디지털 권한 관리(DRM)를 지원하는 다른 또는 독점 음악 파일 형식을 선택하여 디지털 음악의 사용을 제어하고 제한합니다. DRM 지원 형식은 저작권 침해로부터 저작권이 있는 자료를 보호하는 데 사용되지만 대부분의 보호 메커니즘은 어떤 방법으로든 깨질 수 있습니다. 컴퓨터 전문가는 이러한 방법을 사용하여 자유롭게 복사할 수 있는 잠금 해제된 파일을 생성할 수 있습니다. 주목할만한 예외 중 하나는 아직 크랙되지 않은 Microsoft의 Windows Media Audio 10 형식입니다. 압축된 오디오 파일을 얻으려면 녹음된 오디오 스트림을 압축해야 하며 음질이 저하됩니다.

MP3 오디오 품질

MP3는 손실이 있는 형식이므로 다양한 '비트 전송률', 즉 초당 오디오를 표현하는 데 필요한 비트 수에 대한 다양한 옵션을 제공합니다. . 인코딩된 데이터 비트 수. 일반적인 속도는 초당 128~320kb입니다. 이에 비해 CD에 있는 압축되지 않은 오디오의 비트 전송률은 1411.2kbit/s(16비트/샘플 × 44100샘플/s × 2채널)입니다.

낮은 비트 전송률로 인코딩된 MP3 파일은 일반적으로 재생 품질이 낮습니다. 너무 낮은 비트 전송률을 사용하면 재생 중에 "압축 아티팩트"(원본 녹음에 없는 사운드)가 나타납니다. 압축 소음의 좋은 예는 압축된 응원 소리입니다. 임의성과 갑작스러운 변화로 인해 인코더의 오류는 더욱 분명해지고 메아리처럼 들립니다.

인코딩된 파일의 비트 속도 외에도 MP3 파일의 품질은 인코더의 품질 및 신호 인코딩의 어려움과도 관련이 있습니다. 고품질 인코더로 인코딩된 일반 신호를 사용하면 일부 사람들은 128kbit/s MP3 및 44.1kHz CD 샘플의 음질이 CD 음질에 가깝고 압축률은 약 11:1이라고 생각합니다. 이 비율로 적절하게 인코딩된 MP3는 주로 대역폭 제한, 신호 대 잡음비 및 아날로그 미디어의 기타 제한으로 인해 FM 라디오 및 카세트 테이프보다 더 나은 음질을 얻을 수 있습니다. 그러나 청취 테스트에서는 간단한 연습 테스트 후에 청취자가 128kbit/s MP3와 원본 CD의 차이를 확실하게 구별할 수 있음을 보여줍니다. 많은 경우에 그들은 MP3 음질이 너무 낮기 때문에 수용할 수 없다고 생각하는 반면, 다른 청취자들은 다른 상황(시끄러운 차 안이나 파티 등)에서는 음질이 수용 가능하다고 생각할 수도 있습니다. 분명히 MP3 인코딩 결함은 특히 고품질 헤드폰을 사용할 때 컴퓨터에 연결된 고품질 스테레오 시스템보다 저가형 컴퓨터 스피커에서 덜 눈에 띕니다.

FhG(Fraunhofer Gesellschaft)는 비교를 위해 공식 웹사이트에 MPEG-1 레이어 1, 2, 3에 대한 다음 압축 비율과 데이터 속도를 게시했습니다.

* 레이어 1: 384kbit /s, 압축률 4:1

* 레이어 2: 192~256kbit/s, 압축률 8:1~6:1

* 레이어 3: 112...128 kbit/s, 압축률 12:1...10:1

다른 레이어 간의 차이점은 사용하는 심리음향 모델이 다르기 때문입니다. 레이어 1의 알고리즘은 매우 간단합니다. 이므로 투명 인코딩에는 더 높은 비트 전송률이 필요합니다. 그러나 서로 다른 엔코더는 서로 다른 모델을 사용하기 때문에 완전한 비교를 하기는 어렵습니다.

많은 사람들은 인용된 요율이 레이어 2 및 레이어 3 레코드에 대한 선호로 인해 심각하게 왜곡되었다고 믿고 있습니다. 그들은 실제 속도가 아래에 나열되어 있다고 주장합니다.

* 레이어 1: 384kbit/s 우수

* 레이어 2: 256...384kbit/s 우수, 224.. .256kbit/s 양호, 192...224kbit/s 양호

* 레이어 3: 224...320kbit/s 양호, 192...224kbit/s 양호, 128 .. .192 kbit/s 양호

압축 메커니즘을 비교할 때 동일한 음질의 코덱을 사용하는 것이 중요합니다. 오래된 기술을 기반으로 하거나 심지어 결함이 있는 기존 인코더와 새 인코더를 비교하면 이전 형식에 불리한 결과가 나올 수 있습니다. 손실 있는 인코딩으로 인해 정보가 손실된다는 현실 때문에 MP3 알고리즘은 인간 청각의 전반적인 특성에 대한 모델을 구축하여 버려진 부분이 인간의 귀에 인식되지 않도록(예: 노이즈 마스킹으로 인해) 노력합니다. 인코더는 이 시점에서 다양한 수준으로 이를 달성할 수 있습니다.

가능한 인코더:

* LAME는 1998년 초 Mike Cheng이 처음 개발했습니다. 다른 제품에 비해 LGPL을 완벽하게 준수하는 MP3 인코더로 속도와 음질이 뛰어나며 후속 버전의 MP3 기술에도 도전적입니다.

* Fraunhofer Gesellschaft: 일부 코더는 훌륭하지만 일부는 결함이 있습니다.

더 이상 널리 사용되지 않는 초기 코더가 많이 있습니다:

* ISO dist10 참조 코드

* Xing

* BladeEnc

* ACM Producer Pro.

좋은 인코더는 128~160kbit/s에서 허용 가능한 음질을, 160~192kbit/s에서는 거의 투명한 음질을 달성할 수 있습니다. 따라서 특정 인코더나 최고의 인코더를 주제로 128kbit/s나 192kbit/s에서의 음질을 이야기하지 않으면 오해를 불러일으키기 쉽습니다. 128kbit/s의 좋은 인코더로 생성된 MP3는 192kbit/s의 나쁜 인코더로 생성된 MP3보다 음질이 더 좋을 수 있습니다. 또한 동일한 인코더와 동일한 파일 크기를 사용하더라도 고정 비트 속도의 MP3는 가변 비트 속도의 MP3보다 음질이 훨씬 나쁠 수 있습니다.

주의해야 할 중요한 문제는 오디오 신호의 품질이 주관적인 판단이라는 것입니다. 플라시보 효과가 만연해 많은 사용자가 투명성을 위해 특정 품질 수준을 요구한다고 주장합니다. 많은 사용자가 낮은 비트 전송률에서는 파일을 구별할 수 없기 때문에 A/B 테스트에 실패합니다. 특정 비트 속도는 일부 사용자에게는 충분하지만 다른 사용자에게는 충분하지 않습니다.

각 개인의 소리 인식은 다를 수 있으므로 특정 심리음향 모델이 모든 사람을 만족시킬 수 있을지는 확실하지 않습니다. 단순히 오디오 재생 시스템이나 환경과 같은 청취 환경을 변경하면 손실 압축으로 인해 음질이 저하될 수 있습니다. 위에 제공된 숫자는 대부분의 사람들에게 대략적이고 효과적인 참고 자료일 뿐이지만, 손실 압축 분야에서 압축 프로세스의 품질을 테스트하는 정말 효과적인 방법은 오디오 결과를 듣는 것입니다.

품질 손실 없는 오디오 파일을 얻거나 스튜디오에서 사용하는 오디오 파일을 얻는 것이 목표라면 무손실 압축 알고리즘을 사용해야 합니다. 현재 16비트 PCM 오디오 데이터는 38%까지 압축할 수 있으며 사운드는 손실 없음, 이러한 압축 도구에는 Lossless Audio LA, Apple Lossless, TTA, FLAC, Windows Media Audio 9 Lossless(wma) 및 Monkey's Audio 등이 포함됩니다. 편집하고 믹싱해야 하는 오디오 파일의 경우 무손실 형식을 사용하십시오. 그렇지 않으면 처리 후 손실 압축으로 인한 오류를 예측할 수 없습니다. 이러한 손실은 처리 후에 함께 인코딩됩니다. .더 분명해질 것입니다. 무손실 압축은 낮은 압축률을 희생하면서 최상의 결과를 얻습니다.

오디오 일부를 잘라내는 등 일부 간단한 편집 작업은 다시 인코딩하지 않고도 MP3 데이터에서 직접 작업할 수 있습니다. 이러한 작업의 경우 적절한 소프트웨어(mp3DirectCut 및 MP3Gain)를 사용하는 한 위에서 언급한 문제는 무시할 수 있습니다.

비트 속도

비트 속도는 MP3 파일에 따라 가변적입니다. 일반적인 원리는 비트 전송률이 높을수록 사운드 파일에 원래의 사운드 정보가 더 많이 포함되므로 재생 중에 음질이 높아진다는 것입니다. MP3 인코딩 초기에는 전체 파일에 고정 비트 전송률이 사용되었습니다.

MPEG-1 Layer 3에 허용되는 비트 전송률은 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256 및 320kbit/s입니다. 샘플링 주파수는 32, 44.1, 48kHz입니다. 44.1kHz가 가장 일반적으로 사용되는 속도(CD 샘플링 속도와 동일)이고, 128kbit/s가 사실상 "좋은 품질" 표준이지만 P2P 파일 공유 네트워크에서는 192kbit/s가 점점 더 많이 사용되고 있습니다. MPEG-2 및 [비공식적으로] MPEG-2.5에는 6, 12, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 144, 160kbit/s의 다른 비트 전송률이 포함됩니다.

가변 비트 전송률(VBR)도 가능합니다. MP3 파일의 오디오는 서로 다른 비트 전송률을 가진 프레임으로 나누어지므로 파일이 인코딩될 때 비트 전송률이 동적으로 변경될 수 있습니다. 이 기능은 원래 구현에는 포함되지 않았지만 현재는 VBR이 널리 사용됩니다. 이 기술을 사용하면 소리 변화가 큰 부품에는 더 큰 비트 전송률을 사용하고, 소리 변화가 작은 부품에는 더 작은 비트 속도를 사용할 수 있습니다. 이 방법은 정지 부분을 녹음하지 않음으로써 테이프 소비를 절약하는 사운드 제어 테이프 레코더와 유사합니다. 일부 코더는 이 기술에 크게 의존합니다.

LAME 인코더와 무료 형식을 사용하면 최대 640kbit/s의 비표준 비트 전송률을 달성할 수 있지만 이러한 파일을 재생할 수 있는 MP3 플레이어는 거의 없습니다.

MP3 디자인 제한

MP3 형식에는 더 나은 인코더를 사용한다고 해서 단순히 우회할 수 없는 몇 가지 고유한 제한이 있습니다. Vorbis 및 AAC와 같은 일부 새로운 압축 형식에는 더 이상 이러한 제한이 없습니다.

기술적인 측면에서 MP3에는 다음과 같은 제한 사항이 있습니다.

* 최대 비트 전송률은 320kbit/s입니다.

* 시간 해상도는 빠르게 변화하는 것에 상대적입니다. 신호가 너무 낮음

* 15.5/15.8kHz 이상의 주파수에는 스케일 팩터 대역이 없습니다.

* 조인트 스테레오는 프레임별로 수행됩니다.

* 없음 전반적인 인코더/디코더 대기 시간을 정의한다는 것은 끊김 없는 재생에 공식적인 사양이 부족하다는 것을 의미합니다.

그러나 이러한 제한에도 불구하고 잘 조정된 MP3 인코더는 매우 경쟁력 있는 코딩 작업을 수행할 수 있습니다.

MP3 오디오 인코딩

MPEG-1 표준에는 MP3 인코더에 대한 정확한 사양이 포함되어 있지 않습니다. 그러나 반대로 디코딩 알고리즘과 파일 형식은 신중하게 정의되어 있습니다. 코딩 구현은 원본 오디오의 정보 일부(또는 주파수 영역의 수정된 이산 코사인(MDCT) 표현)를 제거하는 데 적합한 자체 알고리즘을 설계하도록 설계되었습니다. 인코딩 과정에서 576개의 시간 영역 샘플이 576개의 주파수 영역 샘플로 변환됩니다. 과도 신호인 경우 576개의 샘플링 포인트 대신 192개가 사용됩니다. 이는 과도 신호에 대한 양자화 노이즈의 단기 확산을 제한합니다.

청각심리학의 연구분야인 인간의 주관적인 소리지각입니다.

그 결과 다양한 MP3 인코더가 존재하게 되었고, 각각은 서로 다른 음질을 만들어냅니다. 잠재적인 사용자가 올바른 인코더를 쉽게 선택할 수 있도록 많은 비교가 있습니다. 기억해야 할 점은 높은 비트 전송률에서 잘 작동하는 인코더(예: 높은 비트 전송률에서 널리 사용되는 인코더인 LAME)가 반드시 낮은 비트 전송률에서 똑같이 잘 수행되지 않을 수도 있다는 것입니다.

MP3 오디오 디코딩

반면에 디코딩은 표준에 신중하게 정의되어 있습니다.

대부분의 디코더는 비트스트림과 호환됩니다. 즉, MP3 파일에서 디코딩된 압축되지 않은 출력 신호는 표준 문서에 수학적으로 정의된 출력 신호와 정확히 동일합니다(지정된 대략적인 오류 범위 내에서).

MP3 파일은 384, 576 또는 1152 샘플링 포인트(MPEG 버전 및 레이어에 따라 다름)의 프레임으로 구성된 표준 형식을 가지며 모든 프레임은 헤더 정보(32비트) 및 보조 정보와 관련되어 있습니다. (MPEG 버전과 스테레오 또는 모노 채널에 따라 9, 17 또는 32바이트). 헤더와 보조 정보는 디코더가 관련 허프만 인코딩 데이터를 올바르게 디코딩하는 데 도움이 됩니다.

결과적으로 대부분의 디코더 비교는 거의 전적으로 계산 효율성(예: 디코딩 중에 필요한 메모리 양 또는 CPU 시간)을 기반으로 합니다.

ID3 및 기타 태그

주요 기사: ID3 및 APEv2 태그

"태그"는 제목 등을 포함하는 MP3(또는 기타 형식)로 저장된 파일입니다. , 아티스트, 앨범, 트랙 번호 또는 MP3 파일에 대한 정보와 같이 파일에 추가된 기타 데이터입니다. 가장 널리 사용되는 표준 태그 형식은 현재 ID3 ID3v1 및 ID3v2 태그이며, 가장 최근의 것은 APEv2 태그입니다.

APEv2는 원래 MPC 파일 형식용으로 개발되었습니다(APEv2 사양 참조). APEv2는 ID3 태그와 동일한 파일에 저장할 수 있지만 독립적으로 사용할 수도 있습니다.

볼륨 노멀라이제이션(normalization)

CD 등 다양한 오디오 소스는 서로 다른 볼륨으로 녹음되기 때문에 파일의 볼륨 정보를 태그에 저장해 놓으면 볼륨을 재생 중에 동적으로 조정됩니다.

MP3 파일 게인 인코딩에 대한 몇 가지 표준이 제안되었습니다. 그들의 디자인 아이디어는 서로 다른 연속 오디오 트랙 사이를 전환할 때 볼륨이 변경되지 않도록 오디오 파일의 볼륨("피크" 볼륨이 아님)을 표준화하는 것입니다.

리플레이 게인을 저장하기 위해 가장 널리 사용되고 일반적으로 사용되는 솔루션은 간단히 "리플레이 게인"이라고 불리는 것입니다. 트랙의 평균 볼륨 및 트림 정보는 메타데이터 태그에 저장됩니다.

선택적 기술

다음을 포함하여 많은 다른 손실 오디오 코덱이 존재합니다.

* MP3의 전신인 MPEG-1/2 오디오 레이어 2(MP2);

* Apple의 iTunes Music Store 및 iPod에서 사용되는 MP3의 후속 제품인 MPEG-4 AAC;

* Xiph.org Foundation의 Ogg Vorbis, 무료 소프트웨어 및 특허가 없는 코덱;

* MP2에서 파생된 Musepack(이전 MP+)이라고도 하는 MPC;

* Thomson Multimedia의 MP3 및 SBR 조합 mp3PRO

* AC-3, Dolby Digital 및 DVD에 사용됨

* ATRAC, Sony Minidisc에 사용됨

* Microsoft용 Windows Media Audio(WMA); 저속 QuickTime용

* AMR-WB+ 휴대전화 및 기타 제한된 대역폭 사용에 최적화된 향상된 적응형 다중 속도 광대역 코덱(향상된 적응형 다중 속도 광대역 코덱); * RealNetworks의 RealAudio는 웹사이트에서 미디어를 스트리밍하는 데 자주 사용됩니다.

* CELP를 기반으로 하는 Speex는 음성 및 VoIP 무료 소프트웨어와 특허가 없는 코덱용으로 특별히 설계되었습니다.

mp3PRO, MP3, AAC 및 MP2는 모두 동일한 기술 제품군에 속하며 모두 대략 유사한 심리 음향 모델을 기반으로 합니다. Fraunhofer Gesellschaft는 이러한 코덱에 사용되는 기술을 포괄하는 많은 기본 특허를 보유하고 있으며 Dolby Labs, Sony Corporation, Thomson Consumer Electronics 및 AT&T는 다른 주요 특허를 보유하고 있습니다.

인터넷에는 그 밖에도 다양한 무손실 오디오 압축 방법이 있습니다. MP3와는 다르지만 다음을 포함한 다른 압축 메커니즘의 훌륭한 예입니다:

* FLAC는 'Free Lossless Audio Codec'을 나타냅니다.

* Monkey's Audio

* SHN(단축이라고도 함)

* TTA

* Wavpack

* Apple Lossless

청취 테스트는 특정 비트 전송률에서 최고 품질의 손실 오디오 코덱. 128kbit/s에서는 Ogg Vorbis, AAC, MPC 및 WMA Pro의 성능이 선두에 있는 반면 LAME MP3는 약간 뒤쳐집니다. 64kbit/s에서는 AAC-HE와 mp3pro가 다른 코덱보다 약간 앞서 있습니다. 128kbit/s 이상에서는 대부분의 청취자가 둘 사이의 큰 차이를 들을 수 없습니다. "CD 품질"은 또한 매우 주관적입니다. 어떤 사람들에게는 128kbit/s의 MP3이면 충분하지만 다른 사람들에게는 200kbit/s 이상이 되어야 합니다.

WMA 및 RealAudio와 같은 새로운 코덱 지지자들은 각자의 알고리즘이 64kbit/s의 CD 품질을 달성할 수 있다고 주장하지만 청취 테스트에서는 다른 결과가 나타났습니다. 그러나 이러한 코덱은 64kbit/s의 음질이 상당히 뛰어납니다. 동일한 비트 전송률에서 MP3의 음질보다 더 좋습니다. 특허가 없는 Ogg Vorbis 코덱의 개발자는 자신의 알고리즘이 MP3, RealAudio 및 WMA의 음질을 능가한다고 주장하며 위에서 언급한 청취 테스트를 통해 이 주장이 확인되었습니다.

Thomson은 자사의 mp3PRO가 64kbit/s에서 CD 품질에 도달한다고 주장하지만 테스터는 64kbit/s mp3Pro 파일이 112kbit/s MP3 파일과 비슷하게 들리지만 80kbit/s까지는 CD 품질에 가깝지 않다고 보고합니다.

MPEG-1/2 비디오에 최적화된 MP3는 일반적으로 48kbit/s 미만의 모노 데이터와 80kbit/s 미만의 스테레오 데이터에서는 제대로 작동하지 않습니다.

인증 및 특허 문제

Thomson Consumer Electronics는 미국, 일본, EU 국가 등 소프트웨어 특허를 인정하는 국가에서 MPEG-1/2 Layer 3 특허 라이센스를 관리합니다. 포함되지 않습니다. Thomson은 이러한 특허의 보호를 적극적으로 강화합니다. Thomson은 유럽 특허청에 의해 EU 국가에서 소프트웨어 특허를 부여받았지만 해당 특허가 유럽 특허 협정(유럽 특허 협약)에 따른 소프트웨어 특허를 참조하세요. Thomson 특허 문서, 라이센스 계약 및 수수료에 대한 최신 정보는 해당 웹사이트 mp3licensing.com을 참조하십시오.

1998년 9월 Fraunhofer Institute는 MP3 소프트웨어 개발자가 "인코더의 배포 또는 판매"라는 내용의 편지를 보냈습니다. 또는 디코더"에는 승인이 필요합니다. 승인이 필요하지 않은 제품은 "Fraunhofer 및 THOMSON의 특허권을 침해합니다. 제조, 판매 또는 사용을 위해 출시됩니다." [MPEG Layer-3] 표준 또는 당사의 특허 제품을 사용하려면 라이센스를 취득해야 합니다. "

이러한 특허 문제로 인해 승인되지 않은 MP3 소프트웨어의 개발 속도가 크게 느려지고 WMA 및 Ogg Vorbis와 같은 대안을 개발하고 환영하는 쪽으로 관심이 쏠리게 되었습니다. Windows 개발 시스템은 특허와 관련된 라이센스 문제를 피하기 위해 MP3에서 자체 Windows Media 형식으로 이동했습니다. 특허가 만료될 때까지 승인되지 않은 인코더와 플레이어는 소프트웨어 특허를 인정하는 국가에서 불법으로 나타납니다. 이러한 특허 제한으로 인해 시대를 초월한 MP3 형식은 계속해서 발전하고 있습니다. 이러한 현상의 원인은 다음 요인에 의해 발생하는 네트워크 효과인 것 같습니다.

* 이 형식은 익숙하지만 그 내용은 모르겠습니다. 다른 대체 형식이 존재합니다.

* 이러한 대체 형식은 MP3에 비해 보편적으로 명백한 이점이 없습니다.

* MP3 형식의 음악이 다수 존재합니다.

* 이 형식을 사용하는 다양한 소프트웨어 및 하드웨어,

* MP3 파일을 쉽게 수정, 복사 및 인터넷을 통해 재배포할 수 있는 DRM 보호 기술이 없습니다.

* 대부분의 가정 사용자는 소프트웨어 특허 분쟁에 대해 인식하지 못하거나 신경 쓰지 않습니다. 이는 개인 용도로 MP3 형식을 선택하는 것과 관련이 없는 경우가 많습니다.

또한 특허 보유자는 부과를 꺼립니다. 오픈 소스 디코더에 대한 라이선스 비용으로 인해 많은 무료 MP3 디코더가 개발되기도 했습니다. 비록 인코더용 바이너리 출시를 막으려고 노력했지만 Thomson은 개별 사용자가 무료 MP3를 사용하기 위해 비용을 지불할 필요가 없다고 발표했습니다. 인코더를 사용하면 MP3 형식을 사용하려는 많은 회사에서 로열티가 문제가 되지만 사용자에게는 문제가 되지 않으므로 형식이 인기를 얻게 됩니다.

Sisvel S.p.A.[1]와 그 미국 자회사 Audio MPEG, Inc.[2]는 이전에 MP3 기술 특허 침해로 Thomson[3]을 고소했지만 해당 분쟁은 2005년 11월에 마무리되었습니다. Sisvel로 끝났습니다. Thomson MP3 라이센스. Motorola는 최근 Audio MPEG와 MP3 라이선스 계약도 체결했습니다.

Thomson과 Sisvel은 코덱에 필요하다고 주장하는 별도의 특허를 보유하고 있기 때문에 MP3 특허의 법적 지위는 불분명합니다.

Fraunhofer의 특허는 2010년 4월에 만료되며 그때가 되면 MP3 알고리즘은 더 이상 특허로 보호되지 않습니다. ]

mp3라고 하면 먼저 MPEG가 Moving Picture Experts Group의 약자라는 점을 먼저 언급해야 합니다. 이 전문가 그룹은 1988년에 설립되었으며 CD의 비디오 및 오디오 압축 표준 설정을 담당합니다. MPEG 오디오 파일은 MPEG 표준의 사운드 부분, 즉 MPEG 오디오 레이어를 나타냅니다. MPEG 파일은 다양한 압축 품질과 인코딩 복잡도에 따라 세 가지 레이어로 나눌 수 있습니다(MPEG AUDIO LAYER 1/2/3은 각각 mp1, mp2, mp3의 세 가지 사운드 파일에 해당합니다. MPEG 오디오 인코딩은 압축률이 높으며, mp1과 mp2의 압축률은 각각 4:1과 6:1-8:1인 반면, mp3의 압축률은 10:1-12:1로 압축 없이 1분 동안 CD 품질의 음악을 감상할 수 있습니다. 10MB의 저장 공간이 필요하며 mp3 압축 및 인코딩 후에는 약 1MB에 불과하지만 음질은 기본적으로 왜곡되지 않습니다. 따라서 mp3는 현재 인터넷에서 가장 일반적인 음악 형식입니다. 소리의 왜곡을 줄이기 위한 '감각적 인코딩 기술' : 인코딩 시 먼저 오디오 파일에 대해 스펙트럼 분석을 수행한 후 필터를 사용하여 소음 수준을 필터링한 다음 양자화를 통해 나머지 비트를 각각 분산 및 배열하고 마지막으로 오디오 파일을 형성합니다. mp3 파일은 압축률을 높여 재생 시 원본 음원에 가까운 음향 효과를 얻을 수 있습니다. 비록 손실 압축이지만 소리 왜곡이 매우 적다는 것이 가장 큰 장점입니다. 1 Audio Layer 3의 약자로서 원본 오디오 신호를 특수 데이터 압축 알고리즘을 통해 처리하므로 디지털 오디오 파일의 크기는 휴대폰 크기의 10분의 1에 불과합니다. MP3의 가장 큰 장점은 음성을 변환할 수 있다는 점입니다. 파일은 원래 크기의 1/10 또는 1/12로 압축됩니다. 지원 모델: Motorola E398, C650, V303, Sony Ericsson K700C, K500C 등 /p>

MP3 영어:

영어 약어: Music Player III

영어 전체 이름: Moving Picture Experts Group Audio Layer III